比对率还高!!!
从Hisat2官网下载了大鼠的基因组索引文件,又从Ensembl网站下载了注释文件,第二天早上发现HTseq结果中所有基因计数都为0,直觉告诉我,应该是注释文件和索引文件中的染色体名称不对应,一个为chr1,一个为1,
为了统一,又从Ensembl网站下载了基因组文件,以便自己构建索引文件。为了节省下载时间,下载了后缀名为dna.rm.toplevel.fa的基因组。结果这次比对率特别低,唯一比对的reads只有73%,比对时间特变长,比之前长了8倍。
Ensembl网站每个物种有三种基因组,后缀名分别为dna.toplevel.fa,dna.rm.toplevel.fa,dna.sm.toplevel.fa,
建议使用dna.toplevel.fa构建索引文件。
网友评论