美文网首页
重磅干货—10XGenomics单细胞转录组FAQ来啦

重磅干货—10XGenomics单细胞转录组FAQ来啦

作者: 生信阿拉丁 | 来源:发表于2021-01-09 09:28 被阅读0次

作者:脑袋瓜~嗡
编辑:angelica

随着09年单细胞转录组技术的现世,使得科研精度从组织转变为单个细胞的层面。10XGenomics单细胞转录组技术作为其中目前来说最为大火的技术,对于细胞发育、肿瘤异质性以及细胞图谱等等方面的研究发挥着越来越重要的作用。今天我们一起看下其中可能遇到的问题吧~

Q1. 什么样的原始数据可以直接用于cellranger分析呢?

A1. 使用cellranger软件进行分析,使用的是:
*_S1_L001_R1_001.fastq.gz
*_S1_L001_R2_001.fastq.gz

分析软件只识别形如以下格式的fq文件:
“Sample Name_S1_L00[Lane Number]_[Read Type]_001.fastq.gz

Q2. 通常样品nGene和nUMI的相关性系数要在0.8以上,但是这次实验的相关性在0.5以下,怎么解释这个情况,得到的实验下机数据还可靠吗?

A2. 影响相关性的因素有文库制备过程的稳定性和细胞状态的一致性。如果相关性较低,可能是由于文库中细胞状态差异较大。

可能与细胞检测时的状态有关,有些细胞可能活性降低,核酸存在降解的状态。

Q3. 检测线粒体表达量目的是为了作为阴性对照吗?正常线粒体基因在细胞中含量不是很多,那检测线粒体表达量是评价测序结果好坏的一个阴性对照吗?

A3. 检测线粒体基因的表达量是一个数据分析质控指标。除了部分特殊类型的细胞(如卵细胞)。如果定位到线粒体的比例高,表明细胞质量较低,这可能是细胞凋亡增加所致。

Q4. valid barcodes只有92%,请问其他的reads是不带标记还是带错误标记呢?如果是错误标记,该错误是在哪一步引入的?

A4. 都会有barcode,这个barcode不在白名单里面,可能是错配较多,或者质量较差。

Q5. 能否根据已知的某一个或者某几个的marker基因,过滤出高表达这些maker基因的细胞,然后对这些细胞重新进行聚类分析呢?

A5. 可以。可以直接计算出每个细胞中这些marker基因的表达比例,然后挑选高表达(需要确定高表达的阈值)这些基因的细胞做后续分析。

Q6. 关注的基因表达量水平比较低,分析中采用的归一化方法对低表达量基因的影响是否很大呢?

A6. seurat分析中,默认采用LogNormalize归一化算法。该归一化对低表达的基因没有影响。

Q7. seurat分析里P_val和p_val_adj要考虑么?p_val_adj有数值为1的,应该选取什么样的数值呢?

A7.seurat软件结果只对avg_logFC有个阈值控制(seurat软件默认),一般为0.25。

condition_avg_logFC: average log2 fold change for condition. Positive values indicate that the gene is more highly expressed in the cluster.

对其他值比如P_val和p_val_adj都没有设定阈值,所以会出现有p_val_adj值为1的结果。

主要原因是由于单细胞数据表达量数据较低(与bulk RNA相比较),设定太严格的阈值可能会造成有些有意义的数据被过滤掉了。

P_val和p_val_adj的值可以参考一下,差异倍数相差不大的话,可以考虑一下这两个值。

参考文献
https://www.biorxiv.org/content/biorxiv/early/2019/03/18/576827.full.pdf

相关文章

网友评论

      本文标题:重磅干货—10XGenomics单细胞转录组FAQ来啦

      本文链接:https://www.haomeiwen.com/subject/peyyoktx.html