标准化方法

作者: 新欣enjoy | 来源:发表于2020-05-13 19:44 被阅读0次

表达矩阵标准化是差异分析的第一步,关于为什么需要标准化及常用的标准化的方法有哪些的一篇笔记。

参考文章

为什么需要标准化?

转录组测序采取的打断基因序列获得基因测序的片段,再将reads比对到参考基因组上,并对读序定量,因而最初的表达矩阵是读序数。那么,当需要对样本进行差异分析时,就必须考虑影响读序数的几个因素。

1. 测序深度

也就是一次测序得到的总reads数,不同样本中,会因为批次、实验方案不同,导致样本测序深度不同。

不同测序深度下基因定量结果

图中:貌似A样本的所有基因表达量都是B的两倍。但如果A样本本身测序量就大呢?也就是说,A和B的“家底”就不同,不能直接放一起比较,要比也要放在同一水平公正去比

2. 基因长度

同一样本中,因为某些基因序列较长,导致比对到该基因的读序更多,而序列较短的基因则显得表达量相对较低。

基因长度影响的表达量

图中: 虽然都位于样本A,但基因X比Y要长,所以比对过程中也有更多的reads落在X上,这样X的获胜很有可能是靠着自己“修长”的身材,而不是靠真正的表达量实力

3. RNA组成

在某些样本中,个别基因的表达量异常高,虽然该样本的其他基因表达量也有较高表达,但是在对不同样本间采用相同的标准化方法时,会因为这个别基因的极高表达而影响该样本的其他基因的相对表达量。

个别极高表达的基因

图中: 本来样本A中的所有基因都比B要高,即使为了公平起见处理一下测序深度,也很有可能是胜出或者打个平手。但A中出现了一个DE基因(可以理解成表达迥异的基因),它的到来让我们误以为样本A的测序深度很高,于是给A的所有基因都除以了一个值,保证和样本B可比。于是,样本A中除了DE以外的基因,最后都被B的对应基因打败了【A中基因含恨而亡,DE很愧疚】

三种不同的实验方案

一般需要进行差异分析的实验样本主要有三种情况,也就是不同的差异分析的样本组合对象。

1. 组间样本比较

也就是不同样本间的差异分析,类似于对照与处理样本的差异分析。比较关注某个样本中相关基因表达上升或下降。

2. 组内样本重复

既然是重复实验样本,也就不希望样本间有明显的表达差异。

3. 组内样本内基因间

我这个组的一个重复样本中的A基因和B基因,哪个表达量更高一些?为什么对于我这个样本,B基因表达量会高于A呢?

几种常用标准化方法

目前普通转录组中常用的标准化方法包括,RPKM, FPKM, TMP, TMM, 及相应差异分析的R包的标准化方法。下表中给出了常用的标准化方法的定义、主要考虑的因素及使用的情况。

几种标准化方法的比较

相关文章

  • 数据标准化处理

    一、标准化的方法 1、Min-max 标准化 min-max标准化方法是对原始数据进行线性变换。设minA和max...

  • 数据的标准化处理&spss操作

    数据标准化的方法:“最小—最大标准化”、“Z-score标准化” 1.最小—最大标准化 原理:将某一问项的原始值x...

  • 标准化方法

    表达矩阵标准化是差异分析的第一步,关于为什么需要标准化及常用的标准化的方法有哪些的一篇笔记。 参考文章 为什么需要...

  • 常用差异表达软件所用的标准化方法及计算P值所用的检验方法

    常用差异表达软件所用的标准化方法及计算P值所用的检验方法

  • 连锁秘籍

    连锁企业常遇问题清单 企业还没找到最好的经营方式和方法,能不能做标准化? 该如何形成形成可复制的标准化体系?标准化...

  • DESeq2中vst标准化那些事

    前言 首先,vst也是基于负二项分布的一种标准化方法我们为什么在大样本数据中需要采用vst的标准化方法呢?这是因为...

  • DESeq2中的标准化方法---vst

    首先,vst也是基于负二项分布的一种标准化方法我们为什么在大样本数据中需要采用vst的标准化方法呢?这是因为: 1...

  • count/rpkm/tpm之间转换代码

    标准化方法原理:https://hbctraining.github.io/DGE_workshop/lesson...

  • 记录“归一化”方法

    最简单的方法就是:标准化方法 还有【重新缩放法】,出自:http://www.nohup.cc/article/1...

  • 代码解读- scanpy.pp.normalize_total

    作者:童蒙编辑:angelica scanpy代码解读来啦~ 单细胞分析第一步是对数据进行标准化,标准化的方法有很...

网友评论

    本文标题:标准化方法

    本文链接:https://www.haomeiwen.com/subject/crssqhtx.html