【文献分享】Benchmarking atlas-level d

【文献分享】Benchmarking atlas-level d

作者: cbio_Yan | 来源:发表于2022-04-01 08:49 被阅读0次

【文献分享】Benchmarking atlas-level d
各种深度学习工具对比
文献阅读-《Benchmarking spatial and s
IxVeriWave WaveApps
Benchmarking
Benchmarking
【elasticsearch】6、倒排索引
2020年第40周（9.28-10.4）复盘
变换器鲁棒性-7：RobustART:Benchmarking
单细胞通路活性计算

本篇文章由德国Institute of Computational Biology， Helmholtz Zentrum München 研究所的两位科学家M. Colomé-Tatché&Fabian J. Theis于2022年发表在Nature methods

原文链接： https://www.nature.com/articles/s41592-021-01336-8#MOESM1

文章用到的代码/流程

pipeline：https://github.com/theislab/scib-pipeline

处理代码：https://github.com/theislab/scib ； https://github.com/theislab/scib-reproducibility

文章亮点：

1，建立各种打分机制，评估了16种integrate methods 在基因表达（scRNA-seq），染色质开放(scATAC-seq)，以及模拟数据上的效果，结果评估主要包含了bio-conservation 和 batch effect 两个方面

2，开放了benchmarking用到的代码，方便大家用来评估和开放新工具

背景

目前各种单细胞测序方法层出不穷，单细胞测序的数据也与日俱增，合理的将各种不同来源，不同组织，或者不同技术产生的单细胞数据整合在一起（在去除batch effect的同时，保留bio-conversation），才能提供可靠的下游分析，进行生物学判断。目前有大于49种的integrate工具可用于scRNA-seq数据的整合，但是缺乏一个量化的对各种方法进行评估选择，以前类似的benchmarking的文章仅仅对低数据量和低复杂度的数据进行了整合和去除batch的评估，不够全面。

实验设计

实验设计FIg 1

13个integrate tasks 通过是否做HVG/scaling 四种方式进行预处理，得到预处理后的结果，之后用16种integate 方法对预处理的结果进行integate分析，不同工具可能会得到3种结果（Graph，embedding， corrected features）。对得到的结果从1，batch removal ； 2， biological variance conservation； 3，scalability 4，usability 方面评估integrate的表现

实验流程拆分思维导图

样本：

tasks table

结果：

human immune cell task

这个task 来自5篇文献，包括人的pbmc和bone marrow 所以作者认为这里有10个batch。综合评分Scanorama (embedding), FastMNN (embedding), scANVI and Harmony 此task中表现最好。

鉴于不同方法得到的结果表现形式不同，将不同工具得到的结果分开评估，例如SAUCIE 可以得到graph和embedding的结果，就作为SAUCIE-gragh 和SAUCIE-embedding 分开计算score

Fig2a

Scanorama 因为很好的integrate了Villani (Smart-seq2)和10X的batch而获得较高评分

scANVI 没有很好的integrate villani batch，并且Erythrocytes 呈现出明显的oetjen batch的偏向性

scANVI 和FastMNN, 都在CD14+ monocytes群中表现出10x的batch

Harmony的isolated label F1 bio-conservation score最低

fig2b-c

overall score： $S_{{\mathrm{overall}},i} = 0.6 \times S_{{\mathrm{bio}},i} + 0.4 \times S_{{\mathrm{batch}},i}.$

具体的计算大家可以去看方法，太复杂啦。

scRNA（5） + simulation tasks（2）

对5个scRNA和2个模拟task测试汇总显示不同工具对batch removal 和biological variance conservation的权衡

最佳工具

simpler tasks： Seurat v3 ；Harmony

complex real data：Scanorama；scVI

all tasks： scGen ; scANVI

在preprocessing的选择上

HVG selection 在大多数的task中有较高的batch removal 和bio- conversation score

full gene set 在trajectory 和cell-cycle conservation中得分较高

scaling 有较高的batch removal 得分和较低的bio conversation 得分

综合比较

scANVI, Scanorama 和 scVI 在scRNA real data中表现最好。

总体来说基于mutual nearest neighbors的方法去除batch的效果比较好，此外deep learning-based methods 结合细胞注释，在去除强batch和保留生物学变化上效果好

Fig3

mouse brain scATAC-seq tasks

scATAC-seq features：peaks， windows， gene（gene activity）

基本上所有的方法在scATAC-seq中的表现都不如scRNA-seq，在scRNA中表现好的方法在Gene activity的评分中相对也比较高。

Liger 和harmony 大力度去除batch effect （而不是bio-conversation），在scATAC的integrate中表现更好。

fig4b-c

scalability和usability

scalability 主要是对task运行过程中的cpu time和peak memory 进行比较，具体结果图在Extended Data fig. 7-8

作者通过下图的10项标准对工具的实用性进行评估，Harmony, Seurat v3 和 BBKNN 对初学者友好，相反， DESC, scANVI 和 trVAE上手比较困难

Extended Data Fig.9

Guide

Fig5a

本文使用的其他生信工具:

Splatter package：生成stimulated data

Scanpy：preprocessing

scikit-learn27 (v.0.22.1)： NMI；ARI

anndata2ri：converted between R and Python data formats

随便聊聊

本文的各种打分方法实在让人眼花撩乱，希望后面有时间能好好看明白。

文章最后的结论基本上还是针对不同的数据特征用不同的方法，或许没有工具可以识别数据特征然后自动匹配方法吗？加上现在多组学技术的兴起，不知道不同组学之间的integrate机制又是怎样的。

相关文章

【文献分享】Benchmarking atlas-level d
本篇文章由德国Institute of Computational Biology，Helmholtz Zentr...
各种深度学习工具对比
参考文献《Benchmarking State-of-the-Art Deep Learning Software...
文献阅读-《Benchmarking spatial and s
文献名称：用于转录本空间分布预测和细胞类型反卷积的单细胞转录组和单细胞空间组学的多种整合方法的基准测试文献链接：h...
IxVeriWave WaveApps
Benchmarking The Latency Benchmarking testThe Latency Ben...
Benchmarking
Objective-C 中使用 Benchmarking 测量效率第一发：CFAbsoluteTimeGetCu...
Benchmarking
Objective-C 中使用 Benchmarking 测量效率
【elasticsearch】6、倒排索引
正排和倒排索引目录 - 正排目录快速查找“benchmarking”所在的页面（倒排）benchmarking...
2020年第40周（9.28-10.4）复盘
计划 2020.9.28-10.4第40周 1.练习手册分享 7d 2.冥想 7d 3.阅读 7d 4.文献阅读 ...
变换器鲁棒性-7：RobustART:Benchmarking
RobustART:Benchmarking Robustness on Architecture Desgin ...
单细胞通路活性计算
Benchmarking algorithms for pathway activity transformati...

网友评论

数据整合

本文标题：【文献分享】Benchmarking atlas-level d

本文链接：https://www.haomeiwen.com/subject/dvcyfftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

数据整合

关于我们|服务条款|联系我们|【文献分享】Benchmarking atlas-level d|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！