美文网首页
tabix 操作VCF文件

tabix 操作VCF文件

作者: 斩毛毛 | 来源:发表于2020-05-18 10:28 被阅读0次

tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF,SAM等格式。

安装

https://sourceforge.net/projects/samtools/files/tabix/

##安装
wget https://sourceforge.net/projects/samtools/files/tabix/tabix-0.2.6.tar.bz2
tar xjvf tabix-0.2.6.tar.bz2
cd tabix-0.2.6/
make

bgzip压缩

# 由于snp数量多,所以vcf文件也非常大,常见做法用bgzip进行压缩
bgzip  -f view.vcf
## 如果想要解压缩,有以下两种用法
bgzip -d view.vcf.gz
gunzip view.vcf.gz

需要注意的是,两种算法虽然有相似之处,但是还是有本质区别的,在对VCF文件压缩时,不可以使用gzip来代替bgzip。

tabix 建立索引

## 对于大型的VCF文件而言,如何快速访问其中的记录也是个难点。tabix可以对VCF文件构建索引,索引构建好之后,访问速度会快很多。tabix对VCF文件建立索引的用法如下
tabix -p vcf view.vcf.gz

注意输入的VCF文件必须是使用bgzip压缩之后的VCF文件,生成的索引文件为view.vcf.gz.tbi, 后缀为.tbi。

例子

## 获取位于11号染色体的SNP位点
tabix view.vcf.gz 11

## 获取位于11号染色体上突变位置大于或者等于2343545的SNP位点
tabix view.vcf.gz 11:2343545

## 获取位于11号染色体上突变位置介于2343540到2343596的SNP位点
tabix view.vcf.gz 11:2343540-2343596

参考

相关文章

  • tabix操作VCF文件

    欢迎关注"生信修炼手册"! tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF...

  • tabix 操作VCF文件

    tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF...

  • Tabix— bgzip操作

    tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF...

  • tbx_index_build failed:

    使用tabix构建vcf的索引时,遇到失败的问题tbx_index_build failed: XXX.vcf....

  • 【转】vcf文件合并操作

    欢迎关注公众号:oddxix最近在做PCA,需要将多个样本vcf合并起来,并且加入千人里中国人的数据,收集到下面的...

  • 使用pysam操作VCF/BCF文件

    使用pysam操作VCF/BCF文件 读取和写出 VariantFile函数得到的是 pysam.libcbcf....

  • Bedtools笔记

    BedTools 笔记 工具目的:探索、处理和操作基因间隔文件(e.g., BED, VCF, BAM)。 学习T...

  • 课题步骤记录

    拿到 raw vcf 文件

  • annovar注释除人类以外SNP

    快速注释已经得到的vcf文件 所需文件 ref.fa gff3文件或者gtf vcf文件 简单流程 1.建立一文件...

  • gwas分析时数据格式转换

    排序 从vcf文件排序开始,可以使用picard,也可以使用vcftools 的vcf-sort vcf转换为pe...

网友评论

      本文标题:tabix 操作VCF文件

      本文链接:https://www.haomeiwen.com/subject/fwayohtx.html