美文网首页生信
vcftools过滤SNP数据2021-02-25

vcftools过滤SNP数据2021-02-25

作者: candel | 来源:发表于2021-03-02 08:48 被阅读0次

一、计算每个SNP缺失频率

 vcftools --vcf Bra.snp.filter.pass.all.bol.really.vcf --missing-site --out SNP_missing

获得的SNP_missing结果,最后一栏为缺失率:


image.png

二、过滤掉缺失率大于10%和非bi-allelic 基因

python ../bin/snp_filter_by_miss_bi-gene.py SNP_missing.lmiss  snp.vcf  snp.filter_by_miss_bi.vcf

三、第二种简单的方法

#过滤掉缺失率大于10%和非bi-allelic 基因
vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9  --min-alleles 2 --max-alleles 2 ---recode -out  SNP
#直接vcftools过滤和转换成plink格式,在转换过程中自动的只保留了 bi-allelic 位点。
vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --plink --out  SNP

参考:
http://vcftools.sourceforge.net/man_0112a.html

相关文章

网友评论

    本文标题:vcftools过滤SNP数据2021-02-25

    本文链接:https://www.haomeiwen.com/subject/xofpfltx.html