美文网首页
使用VEP对植物进行基因注释

使用VEP对植物进行基因注释

作者: 灵动的小猪 | 来源:发表于2018-06-08 09:18 被阅读109次

前两天使用snpeff进行基因注释,结果发现不少错误,所以就是用vep来进行注释,同样的位点,发现vep的注释是对的。

下面是使用笔记。

首先去官网上下载安装包

现在的版本是94(动物),41(植物),如果下载安装包后里面没有INSTALL.pl那就可能是版本更新了
mkdir vep && cd vep
wget -c https://github.com/Ensembl/ensembl-tools/archive/release/94.zip
unzip 94.zip
cd ensembl-vep-release-94
  • 在安装之前先修改cache的地址,就是将INSTALL.pl中209行得地址进行修改,动物的版本植物的版本不一样(注意vep的大小写),我又不知道怎么使用默认的$DATA_VERSION随着植物的版本更新而更新,所以就直接使用了现在最新的版本编号(同样如果需要下载fasta序列的话也可以进行修改)。
vi INSTALL.pl
image

修改过后进行安装

perl INSTALL.pl -c ~/reference/vep/
#有时候会报错,可以使用下面的命令
#perl INSTALL.pl -c ~/ngs/reference/vep/ --NO_HTSLIB
  • 安装程序,-c 后面是你下载cache的位置,默认是$HOME/.vep,安装过程中需要安装API文件,比较费时间,可能需要安装几次才能安装上。然后就是下载cache文件,选择自己物种的编号进行下载,以玉米为例
image

但是有时需要安装一些模块

cpanm DBI
cpanm DBD::mysql

然后将cpanm的安装目录添加到环境变量中去,或者在INSTALL.pl的文件中添加一行
BEGIN { unshift @INC, '/home/free22/perl5/lib/perl5/x86_64-linux-thread-multi' }

安装好了就可以进行使用了

~/biosoft/vep --fasta~/reference/Zea_mays.AGPv4.dna.toplevel.fa --offline --species zea_mays--cache_version 39 --dir_cache ~/reference/vep/ -i maize_file.vcf -o maize_file_vep_annotate.vcf
  • 对变异进行注释,--species 指明物种,--cache_version指明cache的版本号,一些详细的参数去官网上查看。

  • 而对于变异类型的解释,也可以查看详细的说明。

相关文章

网友评论

      本文标题:使用VEP对植物进行基因注释

      本文链接:https://www.haomeiwen.com/subject/cusosftx.html