extension://bfdogplmndidlpjfhoijckpakkdjkkil/pdf/viewer.html?file=https%3A%2F%2Fhuhuaping.com%2Fcourse-statistics%2Fmaterial%2F05-05-reg-goodness.pdf
Pearson 残差度量模型对观测值的预测优度,使得不同线性模型的优度变得可比。
通过对测序深度进行建模,深度与单个基因的表达水平呈线性关系,那么基因在关于深度的线性模型中的预测值
就是在当前深度下由深度影响的正常表达水平,
的结果就是抛开当前深度下正常的表达水平,保留下的 生物差异+技术混淆 的结果,也就是模型的 residule ,对每个基因的 residule 执行标准化得到的结果即 pearson residule ,放在了seurat中的
scale.data槽中。最终的 矫正counts矩阵 基于当前数据集的 median(total_totalUMI) 执行了表达量矫正
,其中,
反映了回归深度下应有的表达量,基于中位数建模的缩放因子矫正批了部分批次差异。通过该回归测量,一定程度上可以补全 drop out 缺失值问题。
sctransform/denoise.R at 0b52965a88a6a9e35fa9e5604afa7e1fb58dfedf · satijalab/sctransform (github.com)
- SCTransform 处理后的
scale.data并不是由seu@assays$SCT@data数据槽归一化得到,而是每个基因回归的Pearson 残差- SCTransform 处理后的
counts矩阵如上所诉方式经过矫正得到- SCTransform 处理后的
data矩阵则通过log1p(counts),
data中存放了有效矫正当前测序数据中存在于每个细胞的深度差异和部分技术噪音,如果需要去除多个批次文库中明显的批次噪音,就需要按整合方式进行批次矫正了(参考下面矫正)。在不同文库上做SCTransform后标准化的data取出来并不可以直接比较,按教程建议merge两个对象之后进行PrepSCTFindMarkers(seu_merge)重新矫正计数,从而在两个文库建立统一标准才可比,或者直接merge在一起后重新做 SCTransform。
SCTransform + Harmony in Seurat for batch correction (biostars.org)
多样本SCT批次差异矫正处理·教程文档: Introduction to SCTransform, v2 regularization • Seurat (satijalab.org)













网友评论