美文网首页
统计fastq文件read长度及read平均长度

统计fastq文件read长度及read平均长度

作者: 小红楼上的树影 | 来源:发表于2022-02-17 12:21 被阅读0次

转录组分析使用stringtie定量后,如果使用DESeq2进行下游分析,需要使用prepDE.py生成read counts矩阵,prepDE.py需要fastq文件的read平均长度,可用以下脚本实现。

运行方式:

sh fastq_average_read_length.sh /home/user/fastq_dir   (fastq文件路径)

脚本内容:

#!/bin/bash

P=${1}

ls ${P} | grep "_paired_fastq.gz" | less > ${P}/fastq_paired_list.txt

for i in $(cat "${P}/fastq_paired_list.txt") ; do

zcat ${P}/${i} | awk  '{if(NR%4==2) print length($1)}'| awk -v i="${i}" '{sum+=$1} END {print i, sum/NR}' ;

done > fastq_average_length.txt

cat fastq_average_length.txt | awk '{sum+=$2} END {print "samples_average", sum/NR}' | less >> fastq_average_length.txt

sed -i "1ifastq average_read_length" fastq_average_length.txt

相关文章

  • 统计fastq文件read长度及read平均长度

    转录组分析使用stringtie定量后,如果使用DESeq2进行下游分析,需要使用prepDE.py生成read ...

  • 文件处理

    此文仅做学习用 打开文件 读取文件 read([size]):如果文件长度超过size,那么只读取size长度的部...

  • 2018-07-08

    这周我们学习了! 文件的读写 使用write()可以完成向文件写入数据 读数据(read) 读单个长度使用read...

  • python处理fastq文件序列

    1.序列长度分布统计 2.FASTQ转换成FASTA 3.统计各种碱基个数及GC%

  • 统计fastq长度分布

    截取长度列j是线程数 f 是长度所在列 得到一列长度数 然后在R 中运行画 最后得出一个分布图 参考

  • 转录组分析(5) - 无参转录组拼接(illumina)

    目的 NGS测序得到的短序列(read)存储于Fastq文件,在经过DNA建库和测序之后,文件中不同read之间的...

  • #介绍文件的操作方式

    1.文件的打开操作 2.文件的关闭操作 3.文件的读写 4.读数据(read) 读单个长度 5.读数据(readl...

  • fasta/fastq序列长度分布统计

    首先得到每条序列的长度,在这里使用seqkit软件。seqkit软件是一个强大的序列处理工具,安装方法参见官方网站...

  • fastq长度计算

    python shell And

  • python生信小练习(三)

    生信菜鸟团的编程练习: 对FASTQ的操作 5,3段截掉几个碱基 序列长度分布统计 FASTQ 转换成 FASTA...

网友评论

      本文标题:统计fastq文件read长度及read平均长度

      本文链接:https://www.haomeiwen.com/subject/eutslrtx.html