美文网首页单细胞测序
Cellranger 5.0系列之二——学习如何运行Cellra

Cellranger 5.0系列之二——学习如何运行Cellra

作者: 锦官与长安 | 来源:发表于2020-12-04 15:07 被阅读0次

此流程比之前的cellranger pipeline相对复杂一些。Cellranger multi可以同时运行转录组数据和免疫组库数据。欢迎讨论。

使用cellranger multi功能分析VDJ和基因表达/Feature Barcode数据

5‘ Chromium 单细胞免疫组库与Feature

Barcode技术可以同时获得VDJ库、细胞表面蛋白、抗原特异性以及基因表达数据。cellranger multi 流程可以并行分析上述多个文库。使用multi流程的优势(相对于分别使用cellranger vdj和cellranger count )在于,它能够在VDJ和基因表达两种数据之间提供更加一致的细胞识别。它包括了如下步骤:

1.在Illumina BCL输出文件夹的基础上,运行cellranger mkfastq,以产生FASTQ文件。

2.在由cellranger mkfastq产生的FASTQ文件基础上,运行cellranger multi

运行cellranger mkfastq

    首先,根据cellranger mkfastq的运行说明,产生FASTQ文件。举个例子,如果flowcell的序列号是HAWT7ADXX,那么cellranger mkfastq输出的FASTQ文件将被放在HAWT7ADXX/outs/fastq_path文件夹。

运行cellranger multi

    运行cellranger multi可以同时产生一个独立文库的单细胞feature counts, VDJ序列和注释。这需要一个config CSV文件,如下表所述。调用cellranger multi 的参数如下:

Multi 的config CSV文件包含了文库定义和实验配置变量。最多由四个部分组成:[gene-expression], [feature], [vdj], 和 [libraries]. [gene-expression], [feature], [vdj]部分最多有两列,用于配置相应的实验部分。[libraries]部分声明了输入FASTQ文件的位置。10X公司提供了可下载的mulit config CSV文件模板。multi config CSV示例文件可从5.0.0 公共数据集中下载。

设定好上述输入参数后,运行cellranger

经过一系列检查以验证输入参数,cellranger multi流程将开始运行。

默认情况下,cellranger将使用系统所有可用的核,来执行流程。你可以使用- - localcores选项指定不同数量的核,例如,- - localcores=16 将限制cellranger一次最多使用不超过16个核。同样地,- - localmem将限制cellranger使用的内存大小。

  这个流程将创建一个新的文件夹,文件夹名称用-- id变量指定(例如/home/jdoe/runs/sample345)。若文件夹已存在,cellranger会将其视为一个已存在的流程,并试图重新运行。

输出文件

成功运行的cellraner multi将出现下列提示信息:

流程的输出文件包含在指定ID的文件夹中(例如sample345)。名称为outs的子文件夹包含主要的流程输出文件:

何时使用multi 流程

基因表达文库代表每个分区(droplet)中的全部聚腺苷酸化mRNA转录本池。TCR或BCR转录本被选择性扩增以创建VDJ文库。因此,基因表达文库相对于VDJ文库而言,更容易检测到包含细胞的分区。如果用multi流程运行基因表达和VDJ数据,那些使用基因表达数据未被识别为细胞的barcodes,将从VDJ数据集中删除。

Cellranger multi中不存在的Features

在cellranger vdj 中可用的- - denovo选项,在cellranger multi中不支持。

Cellranger multi中添加的Features

Cellranger multi 流程支持对每个文库的reads独立进行downsampling,指定速度为0-1之间。它亦允许剪切reads到固定的长度,这个功能在cellranger vdj流程中是不支持的。

相关文章

网友评论

    本文标题:Cellranger 5.0系列之二——学习如何运行Cellra

    本文链接:https://www.haomeiwen.com/subject/faciwktx.html