针对贝瑞的宏转录组测序数据的简单比对,统计比对的结果
构建数据库
makeblastdb -in genome.fasta(基因组文件) -dbtype nucl -parse_seqids -out genome(name)
序列比对
# 默认输入文件为fasta格式
单个fasta文件
magicblast -query reads.fasta -db name(数据库的名字)
两个fasta文件
magicblast -query reads.fasta -query_mate mates.fasta -db name(数据库名字)
#如果输入文件为fastq格式
magicblast -query reads.fastq -db name(数据库名字) -infmt fastq (指定格式)
#双端数据
magicblast -query reads_R1.fastq -query_mate reads_R2.fastq -db name(数据库名字) -infmt fastq (指定格式)-outfmt sam (default)
或者-outfmt tabular : exports a simple tab delimited format ,或者output.gz -gzo (.gz压缩格式)
比对完后使用
samtools flagstat xx.sam 可以导出比对的结果
比对结果
381787190 + 0 in total (QC-passed reads + QC-failed reads)
280027218 + 0 secondary
0 + 0 supplementary
0 + 0 duplicates
372338399 + 0 mapped (97.53% : N/A)
101759972 + 0 paired in sequencing
50879986 + 0 read1
50879986 + 0 read2
79268650 + 0 properly paired (77.90% : N/A)
84762006 + 0 with itself and mate mapped
7549175 + 0 singletons (7.42% : N/A)
966996 + 0 with mate mapped to a different chr
966996 + 0 with mate mapped to a different chr (mapQ>=5)
网友评论