美文网首页
GUTHEALTHY镜像使用笔记

GUTHEALTHY镜像使用笔记

作者: zd200572 | 来源:发表于2018-08-26 11:04 被阅读0次

发现一个中国疾控中心的工作人员zhangwen2001做的一个docker,刚好最近在分析肠道微生物的数据,学习学习。动用我的自以为比较厉害的搜索和查找信息的能力,终于找到了镜像文件。先把github的地址放在这:

https://github.com/zhangwen2001/Guthealthy

这个代码库并没有说明docker hub中有这个镜像,但是我怀着侥幸心理搜索了一下,是可以找到的,开心呀!作者的邮箱是zhangwen@icdc.cn,试了一下,icdc.cn网站是中国疾控的,所以我判断作者是这个单位的人。

一、镜像获取

不过pull这个镜像的过程中还是遇到了一点小问题,提示没有默认的latest版本,于是我尝试使用docker hub上标明的v1.0,成功地拉取了下来,当然,docker安装也是有点小费劲,如果有报错的话,还好有官方教程在。

| 1 | docker pull zhangwen2001``/guthealthy``:v1.0 |

二、镜像使用

| 1 | sudo docker run -it --rm -v /home/zd/microbiome_gut:/test zhangwen2001/guthealthy:v1.0 |

| 2 | cd /test |

| 3 | perl /bioapp/bin/Guthealthy.pl /test/input.fq /test |

得到的报告大概就和软件仓库上介绍的差不多,可以获得的信息有:

1.汇总信息

包括总的reads数,有多少个属,香农指数

2.核心菌群信息

各个菌属的含量,以及正常人的菌群含量平均值

3.致病菌的情况

总共分为三组,从未在正常人中发现的菌;从未在HMP计划健康人中发现的菌;以及其他可能的致病菌。

三、镜像流程初步学习

从运行命令来看,这是一个perl脚本,打开来看了一下发现基本上是把各个软件的串联起来,对于我这个perl门外汉也能看懂,窃喜。作者的代码已经注释的相当清楚,第一步,质控,运行了自己的脚本去过滤低质量reads,输出文件里还有一个fastqc的结果,从序列质量图来看,质控做得相当漂亮,有图为证。

质控之前的质量分布图:

image

质控之后的序列质量分布图:

image

第二步,统计细菌的多样性,作者没有使用最广泛使用的qiime、mothur、vsearch等软件,而是使用了bowtie2去比对一个自建的参考序列集。然后后面同样用bowtie2获得了致病菌的相关信息。话说我也曾经想过用比对去解决双向测序长度短序列不能较好拼接的问题,苦于没有思路,作者的思路值得我深入学习。最后一步是用一个cat命令生成了报告。

| 01 | #!/usr/bin/perl |

| 02 | use strict; |

| 03 | use warnings; |

| 04 | |

| 05 | my $file``=``$ARGV``[0]; ``#fq文件 |

| 06 | my $out``=``$ARGV``[1]; |

| 07 | |

| 08 | print "Step 1: Quality Control for Sequence Data 测序数据质量控制\n"``; |

| 09 | |

| 10 | system "perl /bioapp/bin/read_filter_QC.pl -input $file -outdir $out\n"``; |

| 11 | |

| 12 | |

| 13 | print "Step 2: Genus Num 样本中菌属多样性\n"``; |

| 14 | |

| 15 | system "/bioapp/bin/bowtie2-2.3.2/bowtie2 -x /bioapp/Data/16S-complete-clean.fa -q $out/filter.fq -S filter.sam\n"``; |

| 16 | system "perl /bioapp/bin/bowtie_stat-v3.pl filter.sam /bioapp/Data/16S-complete-clean.taxon $out/filter.fq /bioapp/Data/Core_genus filter.stat\n"``; |

| 17 | |

| 18 | print "Step 3:Pathogen Detection 样本中含有的病原菌\n"``; |

| 19 | system "/bioapp/bin/bowtie2-2.3.2/bowtie2 -x /bioapp/Data/155pathogens.fa -q $out/filter.fq -S filter.bwa.sam\n"``; |

| 20 | #system "/bioapp/bin/bwa-0.7.12/bwa mem /bioapp/Data/155pathogens.fa $out/filter.fq >filter.bwa.sam\n"; |

| 21 | system "perl /bioapp/bin/bwa_stat-v2.pl filter.bwa.sam /bioapp/Data/16S-complete-clean.taxon /bioapp/Data/pathogen.group filter.bwa.sam.stat\n"``; |

| 22 | |

| 23 | print "Step 4: Report 报告生成\n"``; |

| 24 | system "cat filter.stat.genus filter.bwa.sam.stat.species >Report.txt\n"``; |

相关文章

  • GUTHEALTHY镜像使用笔记

    发现一个中国疾控中心的工作人员zhangwen2001做的一个docker,刚好最近在分析肠道微生物的数据,学习学...

  • 黑苹果安装笔记

    title: 黑苹果安装笔记tag: 黑苹果 镜像下载 建议使用原版镜像 官网: https://support....

  • python线性回归基本实现

    通过这个笔记记录以下学习的过程。在使用python实现机器学习,可以使用anaconda (清华镜像下载)去实现。...

  • 如何使用Windows Docker使用Harbor镜像仓库

    如何使用Windows Docker使用Harbor镜像仓库 之前在自己的笔记本的win10环境 安装了docke...

  • 使用 nrm 管理 nmp 源

    全局安装nrm 查看可使用镜像源 使用镜像源 自定义镜像源

  • Docker笔记

    Docker笔记 Docker 镜像常用命令 搜索镜像 docker search java 下载镜像 docke...

  • 在kvm中使用centos cloud image

    制作 CentOS 7 的模板镜像 基础镜像使用 CentOS 官方 Cloud 镜像,并使用 Cloud Ini...

  • docker的使用记录

    使用笔记 1、运行镜像的时候,可以指定名字这样的话下次就可以启动自己命名的应用了 2、删除容器和镜像 删除一个容器...

  • pip镜像设置

    前言 本文使用清华镜像,需要其他镜像的也可以自行搜索 临时使用镜像下载 永久生效

  • docker镜像

    docker镜像使用 列出镜像列表 获取一个新的镜像 查找镜像 删除镜像 创建镜像 更新镜像 设置镜像标签

网友评论

      本文标题:GUTHEALTHY镜像使用笔记

      本文链接:https://www.haomeiwen.com/subject/nqxoiftx.html