美文网首页
bedtools: merge

bedtools: merge

作者: LET149 | 来源:发表于2023-07-26 09:39 被阅读0次

此命令的主要作用是把有相互重叠的片段(或gap小于指定长度的片段)融合成一个片段,使得每个片段都最多出现一次,并减少片段的总数量

merge.png
基本语法
bedtools merge [OPTIONS] -i <BED/GFF/VCF/BAM>
# merge要求的输入格式是BED、GFF、VCF和BAM中的一种
options

-s: 只merge在同一条链上的序列,如果不写则默认为否
-d: gap之间的最大距离
-c: 选择对哪些列进行操作
-o: 对由-c选择的列采取什么操作,需一一对应,每个操作对应一列,此操作只对此列起作用,不对其他列起作用

Notes:在进行merge之前一定要用sort对要merge的文件的染色体名称和每行的染色体起始位置进行sort,且在对染色体起始位置进行排序时,一定要指明是以数字的形式进行排序,否则便是以ASCII码值进行排序。sort是必须的,否则报错。

小技巧:如果只想对同一基因在同一染色体上blast出的结果进行merge,则可把染色体编号和blast原基因号结合成一个字段,然后进行merge

merge的本质:merge只会识别第一列(染色体编号)和第二第三列(分别是染色体的起始位置和终止位置(前开后比)),在merge进行的时候是把染色体位置的最小值和最大值分别和其他行的(同组的)染色体位置的最大值和最小值相比,然后根据-d选项进行merge

相关文章

网友评论

      本文标题:bedtools: merge

      本文链接:https://www.haomeiwen.com/subject/dkdztktx.html