美文网首页
线性回归残差与标准化残差--联系单细胞SCTransform

线性回归残差与标准化残差--联系单细胞SCTransform

作者: Norahd | 来源:发表于2023-04-09 19:52 被阅读0次


extension://bfdogplmndidlpjfhoijckpakkdjkkil/pdf/viewer.html?file=https%3A%2F%2Fhuhuaping.com%2Fcourse-statistics%2Fmaterial%2F05-05-reg-goodness.pdf

Pearson 残差度量模型对观测值的预测优度,使得不同线性模型的优度变得可比。

通过对测序深度进行建模,深度与单个基因的表达水平呈线性关系,那么基因在关于深度的线性模型中的预测值 \hat y 就是在当前深度下由深度影响的正常表达水平,y -\hat y 的结果就是抛开当前深度下正常的表达水平,保留下的 生物差异+技术混淆 的结果,也就是模型的 residule ,对每个基因的 residule 执行标准化得到的结果即 pearson residule ,放在了seurat中的 scale.data 槽中。

最终的 矫正counts矩阵 基于当前数据集的 median(total_totalUMI) 执行了表达量矫正 y_{corr} = \hat y_{median} + (y- \hat y)*\frac {std(residual \ y_{median})}{std(residual \ y)}, \{ \ if(y_{corr} <0)\ \ y_{corr} = 0\},其中,\hat y 反映了回归深度下应有的表达量,基于中位数建模的缩放因子矫正批了部分批次差异。通过该回归测量,一定程度上可以补全 drop out 缺失值问题。
sctransform/denoise.R at 0b52965a88a6a9e35fa9e5604afa7e1fb58dfedf · satijalab/sctransform (github.com)

  • SCTransform 处理后的 scale.data 并不是由 seu@assays$SCT@data 数据槽归一化得到,而是每个基因回归的Pearson 残差
  • SCTransform 处理后的 counts 矩阵如上所诉方式经过矫正得到
  • SCTransform 处理后的 data 矩阵则通过 log1p(counts)

data 中存放了有效矫正当前测序数据中存在于每个细胞的深度差异和部分技术噪音,如果需要去除多个批次文库中明显的批次噪音,就需要按整合方式进行批次矫正了(参考下面矫正)。在不同文库上做SCTransform后标准化的 data 取出来并不可以直接比较,按教程建议merge两个对象之后进行 PrepSCTFindMarkers(seu_merge) 重新矫正计数,从而在两个文库建立统一标准才可比,或者直接 merge 在一起后重新做 SCTransform。


SCTransform + Harmony in Seurat for batch correction (biostars.org)

多样本SCT批次差异矫正处理·教程文档: Introduction to SCTransform, v2 regularization • Seurat (satijalab.org)

相关文章

  • 名词解释

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归...

  • 统计学 残差

    残差与逻辑回归的诊断 文献:Residuals and regression diagnostics: focus...

  • Huber loss

    一种用于回归模型的损失函数,和mse相比,对outliers更不敏感。当残差较小时,损失函数是残差的二次方;当残差...

  • 回归模型的诊断:残差及模型诊断

    残差有很多种类,如普通残差(ordinary residual),皮尔森残差(Pearson residual),...

  • 数据分析:基于DESeq2结果的基因富集分析

    DESeq2常用于识别差异基因,它主要使用了标准化因子标准化数据,再根据广义线性模型判别组间差异(组间残差是否显著...

  • 什么是残差——一文让你读懂GBDT(梯度提升树) 和 Resne

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。在集成学习中可以通过基模型拟合残差,使得集成的模型...

  • 70-线性回归与方差分析

    1、线性回归 1.1 理解回归的汇总结果 调用:当创建模型时,以上代码表明lm如何被调用。 残差统计项:理想情况下...

  • 残差图绘制

    残差图1 --双轴方式 残差图2 -- 组合方式

  • 残差网络

  • 残差网络

    Residual Network 原文:Deep Residual Learning for Image Reco...

网友评论

      本文标题:线性回归残差与标准化残差--联系单细胞SCTransform

      本文链接:https://www.haomeiwen.com/subject/njmbddtx.html