美文网首页生物信息学
一条命令行区分Contigs中的真核原核序列

一条命令行区分Contigs中的真核原核序列

作者: 凯凯何_Boy | 来源:发表于2022-03-09 08:33 被阅读0次

本文介绍一款可用于宏基因组中的分类小软件,简单一条命令可以将上游组装的Contigs进行原核与真核生物区分~

Github地址:https://github.com/patrickwest/EukRep

image-20220226153211440

安装

  • Conda直接安装(python3环境)
conda create -y -n eukrep-env -c bioconda scikit-learn==0.19.2 eukrep

可以看到用到了python中的机器学习的包scikit-leran

  • 使用pip安装
$ pip install EukRep

使用

EukRep -h
image-20220226151836569

常用参数不多:

  • -i: 输入fasta文件
  • -o 输出文件
  • --min 设置最短序列,默认3kb
  • --model : 线性SVM训练模型
  • --seq_names:输出序列ID名称

默认-o 输出预测真核序列

 EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file>

加上--prokarya即可预测出原核生物的序列

EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file> --prokarya <Prokaryote sequence output file>

获得真核生物Bins

Eukrep软件旨在用作后续Bining分析管道中的一部分,可用于获得高质量的真核生物的预测序列或者Binning,详细内容可以看“Genome-reconstruction for eukaryotes from complex natural microbial communities"(West et Al。)文中的方法部分(https://doi.org/10.1101/171355)

另外,作者也提供了一个workfolw例子:https://github.com/patrickwest/EukRep_Pipeline,有需要的可以试一下~~

相关文章

  • 一条命令行区分Contigs中的真核原核序列

    本文介绍一款可用于宏基因组中的分类小软件,简单一条命令可以将上游组装的Contigs进行原核与真核生物区分~ Gi...

  • 生物分类

    1925:原核生物、真核生物1969:原核生物、植物、动物、真菌、原生生物(五界分类系统)1990: 真细菌域...

  • 2021-06-01 U1 snRNA的非剪接功能-1

      相比于原核生物,真核生物编码蛋白质的遗传信息并不是连续的,而是编码序列和非编码序列交替存在,因此要表达正确的蛋...

  • 【陪你学·生信】三、核苷酸序列数据库的使用(2)

    二、使用GenBank 1. 针对原核生物基因的GenBank使用介绍 原核生物基因组相对小,而且DNA序列,mR...

  • genemark

    genemark-原核GeneMarkS genemark-真核GeneMark ES/ET genemark在R...

  • Week 3 L5-6 复制起点-复制基因

    http://mooc.guokr.com/note/16946/#comments 5.1 原核与真核生物复制叉...

  • Meta基因预测:概念

    什么是基因预测 所谓基因预测,简单地讲就是预测编码区(CDS)。 原核生物与真核生物基因的差别: 真核生物基因有内...

  • EDGE-pro: Estimated Degree of Ge

    introduction 转录组定量工具已经有很多了,为什么要专门做一个针对原核生物的工具?真核生物与原核生物的基...

  • 基因的转录调控

    原核生物与真核生物基因表达方式的主要区别 原核生物:基因的转录与mRNA的翻译偶联,转录与翻译同步进行,不存在mR...

  • SSR

    SSR检测 也称简单重复序列,是广泛分布在真核生物基因组中的简单重复序列。 微卫星标记(microsatellit...

网友评论

    本文标题:一条命令行区分Contigs中的真核原核序列

    本文链接:https://www.haomeiwen.com/subject/iyxtdrtx.html