美文网首页
最新10+非肿瘤生信,多组学+机器学习+分子对接揭示肠道毒性机制

最新10+非肿瘤生信,多组学+机器学习+分子对接揭示肠道毒性机制

作者: 生信小课堂 | 来源:发表于2025-09-30 22:05 被阅读0次

一、文章信息

发表杂志名称:International Journal of Surgery

中文标题:聚对苯二甲酸乙二醇酯微塑料暴露增加溃疡性结肠炎风险:多组学整合、机器学习和分子对接揭示肠道毒性机制

英文标题:Polyethylene Terephthalate Microplastics Exposure Enhances the Risk of Ulcerative Colitis: Insights from Multi-Omics Integration, Machine Learning, and Molecular Docking Reveal Intestinal Toxicity Mechanisms

影响因子:10.1

发表日期:2025 年 9 月 22 日

二、研究概述

背景指出,近几十年来聚对苯二甲酸乙二醇酯(PET)的广泛使用导致其微塑料(PET-MPs)在环境中大量存在,对人类健康(包括溃疡性结肠炎,UC)构成潜在威胁,但相关分子机制尚不明确。方法上,研究者利用公共数据库数据预测 PET-MPs 靶点并识别 UC 相关差异表达基因,开展功能富集分析,通过多种机器学习算法筛选枢纽基因并评估,构建并验证风险预测列线图,还进行单细胞测序、分子对接及动物实验,用 Western blot 验证肠道组织蛋白表达。结果显示,确定了 11 个 PET-MPs 诱导 UC 毒性的潜在靶点,筛选出 4 个枢纽基因(CTSK、NAAA、PDE4B、PFKFB3),风险预测模型准确性高,分子对接证实 PET-MPs 与这些基因结合力强,动物实验发现 DSS+PET-MPs 组与 DSS 组相比,部分枢纽基因表达显著变化。结论为该研究揭示了 PET-MPs 可能诱导 UC 的分子机制,为理解 PET-MPs 暴露的潜在健康风险提供理论基础。

三、研究结果

(一)研究分析流程图与 UC 差异表达基因识别结果解读

作者呈现了研究的分析流程图(图 1),清晰展示了从数据获取(如从 PubChem、ChEMBL、GEO 等数据库获取相关数据)、靶点与差异表达基因筛选、功能富集分析、蛋白质相互作用网络构建,到机器学习筛选枢纽基因,再到分子对接、GSEA、SHAP 分析、单细胞测序、CIBERSORT 分析、列线图风险模型构建及动物实验验证的完整研究流程。


在 UC 差异表达基因识别方面,作者对两个数据集 GSE87466 和 GSE75214 进行处理,首先通过 PCA 分析展示了批次效应校正前后样本的分布情况(图 2A、2B),校正前不同数据集的样本分布相对分散,存在明显批次差异,校正后样本分布更为集中,批次效应得到有效消除;接着通过差异表达分析识别出 686 个差异表达基因(DEGs),并用火山图(图 2C)呈现了这些 DEGs 的分布,火山图中每个点代表一个基因,显著上调和下调的基因分别分布在图的两侧,通过颜色或大小等方式区分,同时用热图(图 2D)展示了前 20 个上调和下调的 DEGs 在样本中的表达情况,热图中不同颜色代表基因表达水平的高低,能直观反映基因在不同样本中的表达差异。本段内容完整呈现了研究的整体设计流程以及 UC 差异表达基因的筛选和初步展示结果,为后续研究奠定了数据基础。

(二)PET-MPs 诱导 UC 潜在靶点识别结果解读

作者通过 Venn 图(图 3A)展示了 PET-MPs 相关靶点与 UC 差异表达基因的交集,最终获得 11 个交集基因,将其视为 PET-MPs 诱导 UC 毒性的潜在靶点(PET-MPs-UCs);随后利用 STRING 数据库构建了这些潜在靶点的蛋白质 - 蛋白质相互作用(PPI)网络(图 3B),该网络清晰呈现了各靶点之间的相互作用关系,节点代表靶点基因,节点间的连线代表相互作用;接着通过 Cytoscape 计算了网络中各节点的度值,并根据度值大小进行排序,用不同颜色深度表示度值高低(图 3C),颜色越深代表度值越高,表明该靶点在网络中的作用越关键;最后构建了 PET-MPs - 靶点 - UC 的调控网络(图 3D),直观展示了 PET-MPs 如何通过作用于这些潜在靶点影响 UC 的发生发展。本段通过多种图表全面分析了 PET-MPs 诱导 UC 的潜在靶点及其相互关系,明确了后续研究的关键基因方向。

(三)PET-MPs-UCs 功能富集分析结果解读

作者对 PET-MPs-UCs 进行了 KEGG 通路和 GO 富集分析。在 KEGG 通路富集分析中,通过气泡图(图 4A)展示了相关结果,气泡的大小代表基因数量,颜色代表 P 值,结果显示 PET-MPs-UCs 显著富集于 VEGF 信号通路、花生四烯酸代谢、急性髓系白血病相关过程、化学致癌性 - DNA 加合物形成、NF-κB 信号通路、细胞凋亡以及果糖和甘露糖代谢等多个关键生物学通路;在 GO 富集分析中,分别从生物学过程(图 4B)、细胞组分(图 4C)和分子功能(图 4D)三个方面进行展示,生物学过程方面,PET-MPs-UCs 显著富集于长链脂肪酸生物合成过程、参与出芽血管生成的细胞迁移正调控、对有毒物质的响应、巨自噬正调控等;细胞组分和分子功能方面也呈现出相应的富集特征,通过不同的图表形式(如柱状图)展示了各富集条目下的基因数量及 P 值等信息。本段通过功能富集分析,揭示了 PET-MPs-UCs 可能参与的生物学过程和信号通路,为理解 PET-MPs 诱导 UC 的分子机制提供了重要线索。


(四)机器学习筛选枢纽 PET-MPs-UCs 结果解读

作者采用三种机器学习算法筛选枢纽 PET-MPs-UCs。在 LASSO 分析中,通过确定最佳 lambda 值(图 5A 中垂直虚线所示),从训练数据集中提取出 5 个特征基因,并绘制了相应的 ROC 曲线(图 5A),其 AUC 值为 0.980(图 5B),表明该筛选结果具有较高的预测准确性;在 SVM-RFE 分析中,通过绘制最大准确率和最小误差图(图 5C),从训练数据集中获得 6 个特征基因,对应的 ROC 曲线 AUC 值为 0.961(图 5D);在随机森林分析中,通过设定基因重要性得分 > 5.0,从训练数据集中识别出 4 个特征基因(图 5E),相应的 ROC 曲线 AUC 值为 0.948(图 5F);随后通过 Venn 图(图 5G)展示了三种算法筛选出的特征基因的交集,最终准确识别出 4 个枢纽 PET-MPs-UCs,即 CTSK、NAAA、PDE4B 和 PFKFB3;通过小提琴图(图 5H)分析了这些枢纽基因在训练数据集中 UC 样本和健康对照样本中的表达模式,结果显示 CTSK、PDE4B 和 PFKFB3 在 UC 样本中显著上调,而 NAAA 显著下调;最后通过染色体定位分析(图 5I),明确了 CTSK 和 PDE4B 位于 1 号染色体,NAAA 位于 4 号染色体,PFKFB3 位于 10 号染色体。本段通过多种机器学习算法高效筛选出关键的枢纽基因,并对其表达模式和染色体定位进行了分析,为后续深入研究奠定了关键基因基础。


(五)SHAP 解释性分析结果解读

作者采用 9 种机器学习算法(PLS、RF、DTS、LR、KNN、XGBoost、GBM、神经网络、glmBoost)对已识别的枢纽基因进行验证(图 6A),结果显示随机森林(RF)算法表现出最佳的整体预测性能,具有最高的 AUC 值;为理解 RF 模型的潜在机制,作者利用 shapviz R 包计算了 SHAP 值,并根据贡献大小对基因进行排序,通过瀑布图(图 6B)和力图(图 6C)详细展示了单个样本的分类过程,量化了这 4 个基因对预测分数的累积贡献,清晰呈现了 RF 模型对每个样本的分类依据;柱状图分析(图 6D)显示 NAAA 和 CTSK 是对 RF 模型预测贡献最大的两个基因;蜂群图(图 6E)进一步强调 NAAA 是样本分类的关键决定因素,同时表明这 4 个基因(NAAA、CTSK、PDE4B、PFKFB3)均对预测结果有正向影响,即这些基因表达水平升高与疾病状态相关,与对照样本的表达模式形成对比;散点图(图 6F)证实了 SHAP 值与这 4 个基因表达水平之间存在正相关关系,提示它们之间存在协同相互作用。本段通过 SHAP 分析深入解析了机器学习模型的预测机制,明确了各枢纽基因在模型中的重要性及相互关系,进一步验证了枢纽基因的可靠性。


(六)枢纽 PET-MPs-UCs 风险预测模型构建与验证结果解读

作者利用枢纽 PET-MPs-UCs 构建了 LR 模型,最终风险评分计算公式为(1.9999×CTSK)+(0.5528×PDE4B)+(0.8362×PFKFB3)+(-4.0099×NAAA),在训练集中,UC 患者的风险评分显著高于健康对照(图 7A);基于这些枢纽基因的表达水平,设计了用于 UC 风险预测的列线图(图 7B),该列线图可通过各基因的表达值计算对应的得分,进而预测 UC 风险;通过构建临床校准曲线(图 7C)和决策曲线(图 7D),结果表明所提出的模型对 UC 具有较高的预测能力,校准曲线显示预测风险概率与实际观察结果一致性良好,决策曲线显示在较广的阈值概率范围内具有净获益;通过 10 折交叉验证,该模型的 AUC 值达到 0.978(图 7E);混淆矩阵(图 7F)、敏感性曲线和特异性曲线(图 7G)共同表明该模型具有较高的分类性能。在外部验证中,使用 GSE92415 数据集,统计分析显示 UC 患者的风险评分显著高于对照(图 8A);校准曲线(图 8B)显示预测风险概率与观察结果一致性强,模型估计偏差小;决策曲线分析(图 8C)强调了该模型的临床实用性,在与 UC 诊断相关的广泛阈值概率范围内均有净获益;值得注意的是,该模型在验证集中的 AUC 值达到 0.985,其性能显著优于单个 PET-MPs-UCs(图 8D - G)。本段详细介绍了风险预测模型的构建过程、性能评估及外部验证结果,证实了该多基因整合模型在 UC 预测中的优越性和临床适用性。


(七)枢纽 PET-MPs-UCs 的 GSEA 分析结果解读

作者为进一步探究枢纽 PET-MPs-UCs 在 UC 中的潜在机制,进行了单基因 GSEA 分析(补充材料图 S1)。结果显示,CTSK 的表达与补体和凝血级联反应相关,补体和凝血级联反应是先天免疫反应的关键组成部分,对 UC 发病机制至关重要;NAAA 的表达与氧化磷酸化呈正相关,氧化磷酸化是细胞产生 ATP 的主要过程,其调控异常与包括 UC 在内的多种疾病相关;PDE4B 的表达与 T 细胞受体信号通路相关,T 细胞受体信号通路的激活会驱动细胞因子产生、T 细胞增殖和分化,最终促进 UC 的发展;PFKFB3 的表达与细胞凋亡相关,细胞凋亡在 UC 中存在调控异常,会影响肠道上皮细胞的正常功能和肠道炎症状态。本段通过 GSEA 分析,深入揭示了各枢纽基因在 UC 发生发展中可能涉及的分子机制,为后续研究提供了更具体的方向。


(八)UC 患者免疫微环境分析结果解读

作者为探究 UC 患者与健康对照在免疫微环境方面的差异,首先分析了 22 种免疫细胞类型的分布模式(补充材料图 S2),并详细考察了两组之间这些免疫细胞群体的数量差异。结果表明,UC 样本中有 15 种免疫细胞群体的丰度存在显著差异,具体而言,与健康对照相比,UC 患者的活化记忆 CD4 T 细胞、滤泡辅助性 T 细胞、静息自然杀伤细胞、M0 和 M1 型巨噬细胞、活化树突状细胞以及中性粒细胞的浸润程度更高;随后进行的枢纽 PET-MPs-UCs 与不同免疫细胞亚群之间的相关性分析显示,这些枢纽基因与多种免疫细胞群体存在显著关联。本段通过免疫微环境分析,明确了 UC 患者免疫细胞的异常浸润情况及枢纽基因与免疫细胞的关联,为理解 PET-MPs 与 UC 免疫微环境的相互作用提供了依据。

(九)单细胞水平枢纽 PET-MPs-UCs 表达分析结果解读

作者利用 “Seurat” R 包对 GSE214695 单细胞数据集进行了单细胞分析,首先对筛选出的细胞进行聚类和降维处理,通过 PCA 和 t-SNE 算法,选择前 1500 个高变基因进行后续 PCA 分析,以识别驱动细胞异质性的主成分(图 9A、9B);随后使用 SingleR 包对细胞簇进行注释,共获得 8 种细胞群体,即 B 细胞、中性粒细胞、上皮细胞、单核细胞、树突状细胞(DC)、基质细胞、CD4+T 细胞和肥大细胞,并且观察到 UC 样本和正常样本之间细胞群体数量存在明显变化(图 9C、9D);作者进一步分析了枢纽 PET-MPs-UCs 在这 8 种细胞类型中的分布情况,结果显示 CTSK 在基质细胞中表达水平最高(图 9E),而 NAAA(图 9F)、PDE4B(图 9G)和 PFKFB3(图 9H)虽然分布广泛,但在 UC 条件下,它们在单核细胞中的表达水平最为显著,与正常组相比存在显著差异。本段通过单细胞水平的分析,明确了各枢纽基因在不同细胞类型中的表达分布特征,特别是在 UC 状态下的异常表达情况,为深入理解枢纽基因在 UC 中的作用提供了单细胞层面的证据。


(十)枢纽 PET-MPs-UCs 分子对接分析结果解读

作者通过分子对接分析探究了 PET-MPs 与 4 个靶基因(CTSK、NAAA、PDE4B、PFKFB3)之间的相互作用,利用 CB-DOCK2 数据库生成了 4 个对接结果,并采用 VinaScore 量化配体与蛋白质靶点之间的结合能。结果显示,PFKFB3 - PET-MPs 复合物的 VinaScore 为 - 7.2 kcal/mol(图 10A),表明其具有较强的结合亲和力;PDE4B 与 PET-MPs 结合的 VinaScore 为 - 6.8 kcal/mol(图 10B);NAAA 与 PET-MPs 相互作用的 VinaScore 为 - 5.8 kcal/mol(图 10C);CTSK 与 PET-MPs 结合的 VinaScore 为 - 5.0 kcal/mol(图 10D)。值得注意的是,所有这些结合能得分均低于 - 5.0 kcal/mol,表明 PET-MPs 与这 4 个靶基因之间存在较强的结合亲和力。本段通过分子对接分析,从分子层面证实了 PET-MPs 与枢纽基因的相互作用,为 PET-MPs 影响枢纽基因功能进而诱导 UC 提供了分子水平的支持。


(十一)结肠组织中枢纽基因验证结果解读

作者通过给予 3% DSS 成功建立了结肠炎动物模型,与对照组相比,DSS 组小鼠出现体重减轻(图 11A)和结肠缩短(图 11B)的现象,而当联合给予 PET-MPs 时(即 DSS+PET-MPs 组),与单独 DSS 组相比,这些病理变化进一步加剧;通过 HE 染色和组织病理学评分(图 11C),进一步证实了这些表型和形态学改变。为深入探究潜在的分子机制,作者以对照组为参照,采用 Western blot 分析评估了 DSS 诱导的结肠炎小鼠结肠中 CTSK、PDE4B 和 PFKFB3 的表达水平(图 11D、11E)。结果与之前的发现一致,DSS 组结肠组织中 CTSK、PDE4B 和 PFKFB3 的表达显著上调,而 NAAA 的表达下调;值得注意的是,与 DSS 组相比,DSS+PET-MPs 组中这些蛋白质的表达水平发生了更大程度的改变。本段通过动物实验,在体内验证了枢纽基因在结肠炎中的异常表达以及 PET-MPs 对这些基因表达的影响,进一步证实了 PET-MPs 在加剧结肠炎中的作用及相关分子机制。


本研究旨在探究聚对苯二甲酸乙二醇酯微塑料(PET-MPs)暴露与溃疡性结肠炎(UC)关联的潜在分子机制。研究团队通过整合多数据库数据,运用网络毒理学结合机器学习算法,筛选出 CTSK、NAAA、PDE4B、PFKFB3 这 4 个在 PET-MPs 诱导 UC 中起关键作用的枢纽基因。借助 SHAP 分析验证了机器学习模型的可靠性,明确了各枢纽基因的重要性及相互作用;构建的基于这些枢纽基因的风险预测列线图,在训练集和验证集中均展现出较高的预测准确性和临床实用性。通过 GSEA 分析揭示了各枢纽基因可能参与的生物学通路,如 CTSK 与补体和凝血级联反应相关、NAAA 与氧化磷酸化相关等;免疫微环境分析发现 UC 患者存在特定免疫细胞的异常浸润,且枢纽基因与这些免疫细胞存在关联;单细胞测序分析明确了枢纽基因在不同细胞类型中的表达分布特征;分子对接证实 PET-MPs 与 4 个枢纽基因具有较强的结合亲和力;动物实验进一步验证了 PET-MPs 可加剧 DSS 诱导的小鼠结肠炎,且枢纽基因的表达变化与之前的研究结果一致。综上,该研究全面揭示了 PET-MPs 可能诱导 UC 的分子机制,为理解 PET-MPs 暴露的潜在健康风险及 UC 的防治提供了重要的理论依据和新的研究方向。

相关文章

网友评论

      本文标题:最新10+非肿瘤生信,多组学+机器学习+分子对接揭示肠道毒性机制

      本文链接:https://www.haomeiwen.com/subject/ctfctstx.html