二代的转录组数据异常
read1
image.png
read2
image.png
双端reads 的ID有点不一样,一个是@ERR3201871.1.1 另一个是 @ERR3201871.1.2 ,使用bwa mem 比对时报paired reads have different names 错误,这个问题好像是SRR转化成fastq 参数不当造成的,可以从SRR数据重新转化,也可以将@ERR3201871.1.1 @ERR3201871.1.2 改为 @ERR3201871.1 @ERR3201871.1。
for i in *.fastq.gz;do sed -E "s/^((@|\+)ERR[^.]+\.[^.]+)\.(1|2)/\1/" <(zcat ${i}) > ${i}.fix ;done
BIOstars 讨论












网友评论