1.fastq格式介绍

1.1

1.2

1.3

1.4
#统计reads_1.fq文件种共有多少条reads
zless -SN SRR1039510_1.fastq.gz | wc -l
#.输出reads_1.fq文件中所有的序列ID(即第一行)
zless -SN SRR1039510_1.fastq.gz | paste - - - - | awk -F '{print $1}' | less -S
2.数据质控

2.1

2.2
# 激活conda环境
conda activate rnaseq
# 连接数据到自己的文件夹
ln -s /teach/data/airway/fastq_raw25000/*gz .
# 使用FastQC软件对单个fastq文件进行质量评估,数据放在fqdir路径里,结果输出到qc/文件夹下
qcdir=~/project/Human-16-Asthma-Trans/data/rawdata/qc
fqdir=~/project/Human-16-Asthma-Trans/data/rawdata/fastq
fastqc -t 3 -o $qcdir $fqdir/SRR1039510_1.fastq.gz
# 多个数据质控
fastqc -t 10 -o $qcdir $fqdir/SRR*.fastq.gz
#nohup sh qc.sh >qc.log &
#jobs
# 使用MultiQc整合FastQC结果(将众多zip文件整合在一起)
multiqc *.zip
3.质控报告的理解(html)

3.1

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

3.10

3.11

3.12

3.13

3.14

3.15

3.16

3.17

3.18

3.19

3.20
网友评论