美文网首页
RNA-Seq(1)——构建hg38索引(bowtie2)

RNA-Seq(1)——构建hg38索引(bowtie2)

作者: 三刀之流 | 来源:发表于2019-04-10 15:30 被阅读0次

1、下载hg38文件

​ UCSC官网下载hg38文件,网址http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/,进入到如下界面:


我们可以下载其中的hg38.fa.gz 和质量控制文件md5sum.txt。我直接点击下载了。下载完之后,首先用md5sum.txt进行完整性检验。
> cat md5sum.txt
dcc3ea27079aa6dc3f9deccd7275e0f8  hg38.2bit
1d97953254e25acd112a94895f01c039  hg38.agp.gz
1c9dcaddfa41027f17cd8f7a82c7293b  hg38.fa.gz
435423b167c13a2388d5691dc10a4750  hg38.fa.masked.gz
820796b72974d077281b3386c4fb8295  hg38.fa.out.gz
7645bc6e919eeb19bfc62451afc3c248  hg38.trf.bed.gz
a5aa5da14ccf3d259c4308f7b2c18cb0  hg38.chromFa.tar.gz
e9fddcb1663dd303f1f5d6cbb71d6a82  hg38.chromFaMasked.tar.gz
92910523b903753216ac18945c788d81  hg38.fa.align.gz
273fedff7f16fa2bed0d70c75f79caa2  hg38.gc5Base.wigVarStep.gz
9ed58d68e0998d511a8a58f4f748ce84  hg38.gc5Base.wib
c82fddc1c8ce3120cb5863f7384ed177  hg38.gc5Base.wig.gz
> echo 1c9dcaddfa41027f17cd8f7a82c7293b  hg38.fa.gz > check_md5sum_hg38.txt #复制hg38.fa.gz的MD5号到另一个新的文件中
> md5sum -c check_md5_hg38.txt #验证
hg38.fa.gz: 成功

然后命令行解压。

gunzip hg38.fa.gz

由于文件解压出来后较大,可能会解压很长时间,等一会就好。
解压出来的hg38.fa文件可以用于后续使用。

2、 建立索引(bowtie2)

文件准备:hg38.fa

source activate wes #进入到conda小环境
bowtie2-build hg38.fa hg38 #bowtie2 建立索引

建立索引的时间真的超级长!!!
可以挂到服务器后台运行

nohup bowtie2-build hg38.fa hg38 & > nohup01.out

相关文章

  • RNA-Seq(1)——构建hg38索引(bowtie2)

    1、下载hg38文件 ​ UCSC官网下载hg38文件,网址http://hgdownload.so...

  • 线粒体组装

    1.下载线粒体参考序列 2.构建索引文件 参考Hisat2, Bowtie, Bowtie2和BWA构建基因组索引...

  • 200826 Circ之旅3-构建人类基因组索引

    注:后面可能还会构建鼠源的x参考: RNA-seq(5):序列比对:Hisat2 人类基因组hg19、hg38构建...

  • 索引构建

    1 索引构建 索引构建 建立倒排索引的过程,就是索引构建 索引器 构建索引的程序或者计算机,就是索引器 索引器需要...

  • cocoapods私有库笔记

    构建私有库 索引库:存放索引地方私有库:存放代码地方 1.构建索引库 1.1 构建Cocoapods管理 1.1....

  • day08-存储引擎

    一、回顾 1.1 索引 (1) 聚集索引构建B树的过程 (2) 辅助索引构建B树的过程 (3) 辅助索引细分 单列...

  • day08(上周复习+存储引擎下)

    1、上周复习 1.1、索引 1.1.1、聚集索引构建B树的过程 1.1.2、辅助索引构建B树的过程 1.1.3、面...

  • DAP-seq分析流程

    1.使用bowtie2比对 2.macs2 构建表达峰图 参考地址1参考地址2 参数讲解:-f BAMPE 双端测...

  • Day07-SQL存储引擎

    上节回顾 1. 聚集索引与辅助索引的区别?(面试题) 聚集索引构建B树过程(面试题) 辅助索引构建B树过程(面试题...

  • 1.Empirical assessment of analys

    RNA-seq分析流程分析:RNA-seq数据分析流程主要由序列对比,表达矩阵构建,差异基因鉴定等三大步骤构成【1...

网友评论

      本文标题:RNA-Seq(1)——构建hg38索引(bowtie2)

      本文链接:https://www.haomeiwen.com/subject/rfgniqtx.html