美文网首页
索引建的好,比对时间少

索引建的好,比对时间少

作者: 佳名 | 来源:发表于2020-11-25 23:24 被阅读0次

比对率还高!!!
从Hisat2官网下载了大鼠的基因组索引文件,又从Ensembl网站下载了注释文件,第二天早上发现HTseq结果中所有基因计数都为0,直觉告诉我,应该是注释文件和索引文件中的染色体名称不对应,一个为chr1,一个为1,
为了统一,又从Ensembl网站下载了基因组文件,以便自己构建索引文件。为了节省下载时间,下载了后缀名为dna.rm.toplevel.fa的基因组。结果这次比对率特别低,唯一比对的reads只有73%,比对时间特变长,比之前长了8倍。

Ensembl网站每个物种有三种基因组,后缀名分别为dna.toplevel.fa,dna.rm.toplevel.fa,dna.sm.toplevel.fa,
建议使用dna.toplevel.fa构建索引文件。

相关文章

网友评论

      本文标题:索引建的好,比对时间少

      本文链接:https://www.haomeiwen.com/subject/xnqviktx.html