美文网首页
简单的6分+基因组相关分析,你也可以轻松实现

简单的6分+基因组相关分析,你也可以轻松实现

作者: 生信学霸 | 来源:发表于2023-03-13 13:56 被阅读0次

Characterization of Genomic Alterations in Colorectal Liver Metastasis and Their Prognostic Value

结直肠肝转移的基因组改变的特征及其预后价值

发表期刊:Front Cell Dev Biol

发表日期:2022 Jul 4

影响因子:6.081

DOI:  10.3389/fcell.2021.760618

一、研究背景

        结直肠癌(CRC)是全世界最常见的癌症之一,转移是导致CRC患者死亡的主要原因。肝脏是结直肠癌远处转移最常见的位置,因为它离结直肠很近,转移到肺部、骨骼和神经系统的情况较少。Vermaat等人的研究表明,原发性CRC和相匹配的肝转移灶之间已知参与癌症途径的基因突变存在明显差异。

        然而,CRLM的预后和治疗反应各不相同,需要根据风险对患者进行分层,以进行适当的个体化治疗。一些临床评分,通常基于术前癌胚抗原(CEA)值、切除边缘、原发肿瘤部位、肿瘤TNM分期(T:起源的大小和是否侵犯附近组织;N:受累的附近淋巴结;M:远处转移)、淋巴结转移和肿瘤大小,旨在评估CRLM患者的状况和预测预后。

二、材料与方法

1、数据来源

1) 北京大学肿瘤医院:共有146名患者被纳入,平均年龄为57.62岁,肿瘤起源于左侧结肠,84名肿瘤起源于右侧结肠

2) 公共数据:MSKCC队列的NGS临床数据从GEO数据库下载

2、分析流程

1) 二代测序

2) 突变调用:使用Illumina bcl2fastq软件对测序数据进行解复用,然后用Trimmomatic进行分析,去除低质量(质量<15)或N碱基;用Burrows-Wheeler Aligner(bwa-mem)将数据与hg19参考人类基因组进行比对;用Picard套件和GATK用默认参数进行处理;在IGV中确认真实性;基因组改变的可视化用maftools进行;使用VEP软件对突变信息进行注释;进一步利用ANNOVAR丰富突变的注释结果

3) 基于突变的基因特征构建:LASSO算法被应用于建立基于突变的基因签名

4) 统计数据:生存分析;单变量或多变量的Cox回归分析

三、实验结果

01 - 结直肠肝转移瘤的基因组改变

        作者共分析了144个结直肠肝转移瘤,详细的基因组改变显示在图1A,B。TP53(83%)、APC(69%)、KRAS(43%)和SMAD4(17%)是CRLMs中最常见的突变。TP53和KRAS的主要突变类型是错义突变,而APC的主要突变类型是框架移位插入。此外,从MSKCC队列中提取了CRLMs患者的数据,并重新分析了样本的基因组改变。在MSKCC队列中,TP53(82%)、APC(80%)、KRAS(38%)和PIK3CA(18%)是CRLMs患者中最频繁突变的基因。

图1 不同队列常见突变的基因的分布和突变的频率

        考虑到RAS激活和p53功能丧失在结直肠癌细胞恶性转化中的协同作用,还探讨了RAS和TP53同时突变对CRLM预后的影响。驱动性KRAS突变是CRLM患者总生存期的预测指标(补充图S1A,B)。此外,RAS和TP53的双重突变不是CRLM患者生存率降低的独立预测因素(图S1E)。

补充图S1

        接下来,还对致癌信号通路进行了研究。RTK-RAS是受影响最大的致癌途径,在内部CRLM队列中拥有最多的基因突变(图2A)。在RTK-RAS通路中发生改变的基因中,大多数是CRLM队列中的致癌基因(图2B)。与没有RAS-RAF通路改变的患者相比,有RAS-RAF通路改变的患者的总生存结局是不利的(补充图S2A,B)。还分析了SMAD家族基因突变以及内部队列中SMAD通路和RAS-RAF通路改变的综合影响,SMAD通路的改变对CRLM患者的总生存期没有明显影响(补充图S2C,D)。在SMAD途径和RTK-RAS途径都有改变的患者,其预后与这两个途径都没有突变的患者明显不同(补充图S2)。

图2 RTK-RAS途径中的致癌途径变化和特定基因改变 补充图S2

02 - 原发肿瘤部位的基因组差异

        对左侧和右侧结直肠肝转移患者的总基因突变负担和常发突变部位进行了分析。比较了CRLM和TCGA队列中的肿瘤的TMB值。与源自右侧的结直肠肝转移瘤相比,源自右侧的结直肠肝转移瘤的肿瘤突变负担(TMB)值更大(图3A)。在CRLM中10个最显著突变的基因中,TCF7L2在右侧(29.2%)的改变频率明显高于左侧(9.2%)的肿瘤(图3B)。FBXW7突变频率在起源于左侧的CRLM(14.2%)和起源于右侧的CRLM(0%)之间有微小的显著差异(图3B)。然后,比较了源自左侧和右侧的CRLMs中50个最显著突变的基因。共包括75个基因。在这75个基因中,KRAS、AMER1、NSD1、EPPK1、PIK3R1、ACVR2A、EPHB1、HNF1A、EZH1和CD1D的突变在源自右侧的CRLMs中富集(图3C)。

图3 按主要部位分类的基因组改变

03 - 建立基于突变的CRLM患者总生存率的基因签名

        用单变量Cox分析来分析基因突变和总生存率之间的关系。在整个内部队列中,超过3%的样本发生突变的基因被筛选出来,然后进行单变量Cox回归。总共有八个基因突变在CRLM患者中显示出不利的总体生存结果(图4A)。进行LASSO Cox回归,用六个基因建立了一个基于突变的基因特征(图4B,C)。内部CRLM队列的患者被分层为高风险(至少一个基因突变)和低风险组(六个基因都没有突变)。KM分析和单变量Cox回归显示,与至少有一个基因突变的患者相比,没有这六个基因突变的患者具有有利的总生存结果(图4D)。这六个基因的详细突变类型见图5E。错义突变是BRCA2、KRAS、TSC2和PIK3CA中最常见的突变类型,而无义突变是PIK3R1和LATS2中最常见的。通过基于突变的基因签名,在内部的结直肠肝转移队列中,关于肝切除的总生存率,可以将患者分为高风险和低风险组(图4F)。为了进一步验证基于突变的基因特征,作者将其应用于一个外部队列。在MSKCC结直肠肝转移队列中被归类为高风险(至少一个基因突变)的患者与被归类为低风险(无突变)的患者相比,总的生存结果是不利的(图4G)。

图4 基于突变的基因特征构建

04 - 建立Mut-CS评分系统以改善风险评估和分层

        将基于突变的基因特征和临床变量结合起来,建立一个Mut-CS评分系统,以改善风险评估和分层

        KM图和单变量Cox回归显示,在内部CRLM队列中,Fong-CRS和原发部位对患者的生存进行了分层(图5A,B)。在内部CRLM队列中,与右侧原发肿瘤患者相比,左侧原发肿瘤患者的生存率较高。此外,Fong-CRS较高(>2)的患者与Fong-CRS较低(≤2)的患者相比,其生存状况略显不利。

        Fong-CRS是临床实践中的一个有用工具。最近,一项研究提出了扩展临床评分(e-CS)的概念,考虑到转移的大小、淋巴结状态和RAS/RAF途径以及SMAD家族的改变。作者建立了一个新的mut-CS计分系统:转移的大小(>5厘米为1分)+淋巴结状态(>阳性为1分)+原发部位(右侧为1分)+转移数目(>1为1分)+CEA值(>200为1分)+转移状态(同步为1分)+∑系数(基因突变i)(来自图4C)×突变状态,并比较Fong-CRS得分的预测能力。e-CS、原发部位、合并RAS和TP53突变以及mut-CS评分系统的预测能力(图5C)。mut-CS系统的平均预测能力大于Fong-CRS、e-CS、合并RAS和TP53突变以及其他临床特征。KM和单变量Cox回归分析显示,mut-CS高(>3)的患者预后差(图5D)。

图5 建立mut-CS评分系统

四、结论

        总之,作者揭示了CRLMs的基因组改变,这为不同原发肿瘤部位的转移所看到的临床差异提供了潜在的生物学解释,并能够确定预后因素。mut-CS评分系统结合了Fong-CRS、原发部位和基于突变的基因签名,与现有的Fong-CRS相比,显示了对个别患者风险评估的改进。作者希望本报告中描述的基于突变的基因签名和mut-CS评分系统能够成为识别高风险CRLM患者的有用工具,这些患者可能从辅助治疗中获益,并有助于CRLMs的个性化管理。

相关文章

  • 在NCBI查找指定物种基因组信息

    【原创】在NCBI查找指定物种基因组信息 生信分析中经常需要查找指定物种的基因组信息。如:基因组相关分析中需要借助...

  • 组装简介

    基因组 应该是 生信分析的基因组。一个好的基因组会让生信分析事半功倍。基因组组装简单的理解:借助工具进行 read...

  • 轻松实现 Android 图表 • ECharts

    本文是关于 Android 图表实现的一个实践笔记。简单封装百度的 ECharts,轻松实现各种图表效果。 相关 ...

  • 宏基因组组装:从what 到how

    宏基因组分析教程microPITA | 宏基因组测序前,你可以这样筛选样本 microPITA 加拿大安大略研究所...

  • 相关

    相关分析与回归分析是密不可分。 简单相关、偏相关、部分相关。 简单相关:皮尔逊相关。 工具:Excel、SPSS。...

  • 生物信息学视频课程

    1. 热点分析    1. 全基因组关联分析(GWAS)基础内容及实战    2. 免疫相关lncRNA预后模型文...

  • 160、如何使用Pyhton操作数据库?

    我们可以单独使用Mysql进行数据分析,也可以将Python和Mysql结合起来实现更丰富的应用,比如实现简单的增...

  • 使用anvi'o 进行微生物pangenomics泛基因

    1.数据下载 2.数据解压 2.泛基因组数据库的构建 泛基因组分析 后面还可以对其泛基因组功能进行分析,感兴趣的大...

  • 可以从fasta中提取基因序列的4款软件

    前言   做生分析有时候需要从基因组fasta文件中提取基因的序列,对于这个需求有不少现成的软件可以来实现,今天来...

  • SNP x SNP 上位效应(epistasis)分析

    传统的全基因组关联分析(GWAS)计算的是单个SNP与表型的相关性,除此之外,我们还可以进行SNP之间的互作效应与...

网友评论

      本文标题:简单的6分+基因组相关分析,你也可以轻松实现

      本文链接:https://www.haomeiwen.com/subject/okecrdtx.html