美文网首页
5.7分非肿瘤生信,热点基因集+WGCNA+免疫+3种机器学习+

5.7分非肿瘤生信,热点基因集+WGCNA+免疫+3种机器学习+

作者: 生信小课堂 | 来源:发表于2024-08-31 19:49 被阅读0次

研究概述:非酒精性脂肪性肝病(NAFLD)是一种广泛的慢性肝病,包括单纯性脂肪性肝炎(SS)和非酒精性脂肪性肝炎(NASH)。尽管对这种疾病进行了广泛的研究,但其发病机制和从SS进展为NASH的机制仍然知之甚少。越来越多的研究证实了免疫系统在 NAFLD 进展的不同阶段的关键作用。在这项研究中,作者通过WGCNA、差异表达分析和免疫相关基因(IRGs)筛选出28个关键IRGs。GO和KEGG富集分析发现上述28个关键IRGs主要富集于细胞因子相关通路以及免疫细胞活化和趋化性等生物功能。使用蛋白质-蛋白质相互作用网络 (PPI) 和三种不同的机器学习算法获得了JUN和CCL20两个核心基因。并发现这两个核心基因与免疫细胞浸润水平显著相关。该研究发现可以帮助指导,并精准定位NAFLD的各个阶段。研究流程如下:

研究结果:
WGCNA网络构建

为了鉴定与SS相关的基因,作者选择GSE89632数据集中正常和SS患者的数据来进行WGCNA聚类分析,切割高度设置为120,以此过滤掉异常值样本(如图 2A);去除异常值后,作者绘制了一个样本聚类树(如图 2B);作者选择了前 10000 个基因进行后续分析。使用 β = 14 作为软阈值创建邻接矩阵(如图 2C),确保基因分布遵循无标度网络;作者设置minModuleSize = 30 和 mergeCutHeight = 0.25 将上述基因进行聚类分析,共分为11个模块(如图 2D)。此外,作者还分析了各个模块之间的相关性(如图 2E)。为了进一步研究模各模块与不同表型之间的关系,作者计算了每个模型与SS和正常患者的相关系数。结果表明SS与6个模块具有统计学上的显著相关性。其中,SS与“brown”,“red”,“blue”和“magenta”四个模块高度相关(如图 2F)。接下来,作者对这 4 个模块的模块成员 (MM) 和基因显着性 (GS) 相关性进行了分析。发现这 4 个模块的 MM 和 GS 之间显著正相关(图2G)。经上述分析。最终,共获得了2939个与SS相关的关键基因。


与NAFLD发病和进展有关的关键IRGs的鉴定

接下来,作者选择数据集中的SS和NASH患者数据来识别与SS发展相关的调控基因。基于|log2FC|≥ 0.25,p 值< 0.05作为参与 SS 进展的 DEGs筛选的条件,共获得1222 个基因。在这些基因中,包括694个基因上调,528个基因下调(如图 3A),将前30个DEGs的基因表达量变化用热图展示(如图 3B)。作者从ImmPort数据库中共获得1765个IRGs。将通过WGCNA获得的模块内基因以及,与SS 相关的 DEGs以及IRGs取交集,共发现28个基因同时存在于三个基因簇中(如图 3C)。随后,作者比较了正常组与SS组之间以及SS组与NASH组之间基因表达的变化。其中, 6 个基因在 SS 患者中上调,而 22 个基因在正常样本中上调 (如图3D)。与SS患者相比,这28个基因中的大多数在NASH患者中高表达(如图 3E)。此外,作者还分析了这些基因之间的相关性(如3F、G),大多数基因之间显著相关。这表明大多数基因可能发生相互作用并参与同一途径。


28个关键IRGs的富集分析

为了探究这28个关键IRGs可能参与的生物功能和通路,作者进行了GO和KEGG富集分析。共获得了 298 个显著相关的生物过程,以及 23 个 KEGG 信号通路。GO结果显示,这些基因主要参与“白细胞迁移”、“髓样白细胞激活”和“细胞因子介导的信号通路”等生物学过程;可能会影响“细胞因子活性”、“细胞因子受体结合”和“受体配体活性”等分子功能;主要分布于“细胞膜外侧”、“分泌颗粒膜”和“细胞膜信号接受体复合物”等细胞结构(如图4A)。作者还分析了前10个基因与上述过程的相关性(如图4B)。KEGG结果显示,这些基因主要参与“细胞因子-细胞因子受体相互作用”、“Th17细胞分化”、“类风湿关节炎”、“IL-17信号通路”、“NF信号通路”T等途径。研究发现,这些途径与免疫应答以及炎症反应显著相关。


PPI网络分析

接下来,作者通过访问STRING数据库构建关键IRGs的PPI网络(其中4个基因被踢出,因为它们与其他基因没有相互作用)(如图5A)。另外,作者通过MCODE工具识别功能模块,其中最重要的模块包括8个基因。将这8个基因通过MCC算法,获得其相互作用关系(如图5B)。


集成 LASSO 分析、RF 算法和 SVM 筛选核心基因

为了筛选出核心基因,作者通过构建正常组与SS组之间的LASSO Cox回归模型识别上述8个基因中最有价值的诊断基因特征,共鉴定出4个潜在基因(如图6A、B)。接下来,作者通过RF算法评估了每个基因的意义,并确定了这8个基因的排名,作者选择了最重要的前 5 个基因作为潜在基因(如图6C)。同时,作者利用机器学习技术和 SVM 对不同基因进行分析,结果表明选择前五个基因作为潜在基因最合适(如图 6D、E)。最后,作者将上述3个筛选结果取交集,发现JUN和CCL20可以作为核心基因(如图 6F)。


核心基因的表达和诊断功效鉴定

为了对这两个基因进行更深入的研究,作者分析了两个核心基因在正常组与SS组以及SS组与NASH组中的表达情况。结果显示,这两个基因均在SS患者中下调,并且与SS患者相比,在NASH患者中高表达,这表明这两个基因在疾病不同阶段可能发挥着相互矛盾的功能(图7A、B)。为了确认这两个核心基因的诊断意义,作者绘制了ROC曲线,并确定了这些基因的曲线下面积(AUC)。在正常组与SS组中,这两个基因的AUC均为0.925,而两个基因的联合诊断效果优于任何单个基因(AUC:0.9417)(图7C)。在SS组与NASH组中,JUN和CCL20的AUC分别为0.7579和0.8421,这两个基因的联合诊断效果并未提高(AUC:0.8289)(图7D)。


通过GEO数据集和小鼠模型验证核心基因表达和诊断效果

为了验证核心基因的表达情况和诊断效果,作者通过GSE135251数据集进行了平行验证。研究结果表明,核心基因的表达情况与上述结果一致。此外,在GSE135251数据集中,两个基因都具有良好的诊断效果(如图 8A、B)。此外,作者还通过动物实验进行验证,H&E染色结果显示,SS组和NASH组有明显的脂肪堆积,NASH组有大量免疫细胞浸润(如图8C)。与正常组相比,SS组中两个核心基因的表达显着降低。相反,与SS组相比,NASH组中这两个基因的表达水平显著上调(如图8D、E)。


免疫浸润分析相关性分析

肝脏微环境中的免疫失调可能与NAFLD的发生和发展有关。因此,为了理解SS的发展及其向NASH的进展与免疫失调的相关性,作者利用ESTIMATE算法来计算免疫细胞的浸润水平情况。结果显示,与正常组相比,SS 患者的免疫评分、基质评分和 ESTIMATE 评分均显著下降(如图 9A、C、E)。相比之下,与SS患者相比,NASH患者的免疫评分、基质评分和ESTIMATE评分明显升高(如图 9B、D、F)。


相关性分析

此外,作者使用 ssGSEA方法评估了正常组和 SS 组以及 SS 组和 NASH 组之间的 28 个免疫细胞亚群的丰度差异(如图 10A、B)。与正常组相比,SS患者的免疫细胞浸润水平更高。与SS患者相比,NASH患者中活化的CD4 T细胞浸润水平较高。作者对SS和NASH患者的免疫细胞进行了相关性分析(如图 10C、D)。此外,作者还对 JUN 和 CCL20 与免疫细胞含量之间的相关性进行了分析。在SS患者中,JUN表达与浆细胞样树突状细胞呈显著正相关,而CCL20表达与CD56亮自然杀伤细胞呈显著负相关(如图 10E)。在NASH患者中,JUN表达与巨噬细胞呈显著负相关;CCL20 表达与活化的 CD4 T 细胞呈强正相关(如图10F)。上述结果表明,JUN 和 CCL20两个核心基因促进了NAFLD患者在整个疾病进展过程中的免疫反应。


研究总结:

这项研究阐明了肝脏在疾病不同阶段的免疫状态,以及调节免疫微环境的核心基因和机制。作者提出IRGs在NAFLD疾病不同阶段的表达水平存在动态变化,并且主要通过细胞因子相关途径和免疫细胞活化和趋化性来调节肝脏的免疫微环境,这表明在疾病的不同阶段,治疗可能不一致。其中,JUN和CCL20可能是促进疾病发生发展的关键分子,具有作为诊断标志物和治疗靶点的潜力。

相关文章

网友评论

      本文标题:5.7分非肿瘤生信,热点基因集+WGCNA+免疫+3种机器学习+

      本文链接:https://www.haomeiwen.com/subject/lfqqljtx.html