美文网首页
sort配合awk对 GTF文件进行重新排序

sort配合awk对 GTF文件进行重新排序

作者: 倚剑听雨喧 | 来源:发表于2018-01-11 15:24 被阅读0次

Hello,我是倚剑听雨,每日随手更新~带你看生信小白的日常!

如果你也打算在 hg19的 GTF 文件里添加 tRNA和 rRNA 的数据。

首先,tRNA 数据可以在GENCODEGRCh38.p10版本中下载Predicted tRNA genes。

其次,rRNA 的5s 5.8s 28s 18s 来自https://en.wikipedia.org/wiki/Ribosomal_RNA的前四个Reference。

使用 cat 命令可以合并两个 GTF 文件

cat A B > C

不过 GTF 往往必须经过排序才可以使用。比对hg19的 GTF发现其 GTF 格式先按照染色体排序,然后相同的染色体又对 Start position,也就是第四列进行排序。

通过使用sort配合awk可以简单的实现对 GTF 文件的排序。下面是我的代码

cat A.gtf | awk -F '\t' -v OFS=',' '{$1=$1;print}' | sort -t, -k1,1 -k4,5n | awk -F ',' -v OFS='\t' '{$1=$1;print}' > A.sorted.gtf &

注意:请确保你的 GTF 文件是 tab 键分隔,否则请改变 awk 的分隔符参数-F

转载请注明出处,违者必究。

相关文章

  • sort配合awk对 GTF文件进行重新排序

    Hello,我是倚剑听雨,每日随手更新~带你看生信小白的日常! 如果你也打算在 hg19的 GTF 文件里添加 t...

  • sort原理

    sort()对数组进行排序,原数组改变 sort()方法没有参数时,按照ascii码对元素进行排序 sort()方...

  • sort命令使用总结

    简介 sort命令可以对一个或者多个文本文件的内容进行排序。sort命令不会对文件本身内容进行实际排序,只是有序输...

  • MATLAB:矩阵排序问题(sort/sortrows)

    (1)对矩阵的每行进行升序排序:sort(A,2) (2)对矩阵的每列进行升序排序:sort(A,1) (3)对整...

  • leetcode--05. 链表插入排序

    题目:Sort a linked list using insertion sort使用插入排序对链接列表进行排序...

  • shell-sort命令

    通过sort对输出进行排序。 语法 实例 对排序结果进行去重

  • miRNA array笔记1

    1. 对gtf文件进行处理: cat GSE52313_transcripts.gtf | grep "gene_...

  • list列表

    1. sort()方法 对原列表进行排序 描述sort() 函数用于对原列表进行排序,如果指定参数,则使用比较函数...

  • sort命令讲解

    sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出。sort命令既可以从特定的文件,也可...

  • 处理数据文件(一)

    sort sort 命令会按照会话指定的默认语言的排序规则对文本文件中的数据进行排序。 不难发现,sort 命令并...

网友评论

      本文标题:sort配合awk对 GTF文件进行重新排序

      本文链接:https://www.haomeiwen.com/subject/iraznxtx.html