美文网首页
文献笔记六十七:鉴定植物线粒体基因组重复序列

文献笔记六十七:鉴定植物线粒体基因组重复序列

作者: 小明的数据分析笔记本 | 来源:发表于2020-08-21 23:11 被阅读0次
文章题目

Repeats of Unusual Size in plant mitochondrial genomes: identification, incidence and evolution

期刊及完成单位

G3 Genes | Genomes | Genetics
生物3区
影响因子 2.744
University of Nebraska

这篇论文的具体研究内容和结论还没有看太明白,目前自己的关注点是这篇论文里提供了一个python脚本ROUSFinder.py,利用blast鉴定线粒体基因组中的重复序列(non-tandem repeat)

这个脚本的使用方法是

python2 ROUSFinder2.py MH645952.fna

脚本是用python2写的
使用前提是blastn已经安装到了/user/bin/目录下,如果blastn没有安装到这个目录下,可以使用-b参数指定blastn的所在路径
默认的重复序列最小长度是50,可以通过-m参数来修改
这个脚本可以在论文提供的附件中下载
https://gsajournals.figshare.com/articles/Supplemental_Material_for_Wynn_and_Christensen_2018/7425680
但是他放到了word文档了,自己要用的话需要我们复制到文本文件中,大家可以自己去下载或者到我的公众号留言。

脚本的输出文件有4个
比较重要的是以_rep_table.txt结尾的文件,内容是

MH645952.1 UNVERIFIED: Actinidia eriantha mitochondrion sequence    772753
Repeat_1    360 12271   12630   plus
Repeat_1    360 131392  131033  minus
Repeat_2    337 191136  191472  plus
Repeat_2    337 312453  312789  plus
Repeat_3    224 15473   15696   plus
Repeat_3    224 621422  621199  minus
Repeat_4    196 417707  417902  plus
Repeat_4    196 624968  624773  minus
Repeat_5    171 117565  117735  plus
Repeat_5    171 625254  625084  minus
Repeat_6    166 339742  339907  plus
Repeat_6    166 696757  696922  plus
Repeat_7    162 9588    9749    plus
Repeat_7    162 452326  452165  minus
Repeat_8    160 15235   15394   plus
Repeat_8    160 621660  621501  minus

包括重复序列的长度,起始位置,正负链等信息

欢迎大家关注我的公众号
小明的数据分析笔记本

相关文章

网友评论

      本文标题:文献笔记六十七:鉴定植物线粒体基因组重复序列

      本文链接:https://www.haomeiwen.com/subject/ucxmjktx.html