美文网首页文章套路
发文——踩好点、选好数据很重要

发文——踩好点、选好数据很重要

作者: 概普生信 | 来源:发表于2020-07-03 10:17 被阅读0次

今天跟大家分享的是一月份发表在JOURNAL OF CELLULAR PHYSIOLOGY杂志(IF :5.55)上的一篇文章。文章主要讲的是,研究人员通过绝对收缩和选择算子方法以及COX回归模型等生信手段,构建了一个可以预测胃癌Ⅱ期和Ⅲ期复发风险的特征,可以作为预后评估,帮助临床医生识别高危患者的有力工具。

A 16‐mRNA signature optimizes recurrence‐free survival

prediction of Stages II and III gastric cancer

16-mRNA特征有效预测胃癌Ⅱ期和Ⅲ期的无复发生存

一、 摘要:

胃癌世界上最普遍的恶性肿瘤之一,尽管不断改进治疗方案,死亡率依旧在排在世界前列。临床诊断中,即使患者具有相同的TNM分期(tumor, lymph node, metastasis),可能基于肿瘤分子特征不一,生存情况也各不相同。因此,对评估术后复发风险的有效方法需求日益迫切。基于此,研究人员通过绝对收缩和选择算子的方法以及COX回归模型,在三个临床患者数据集内,开发了一个可以有效预测胃癌二、三期复发风险的工具,将有效提高临床诊断预后评估水平。

二、材料方法:

1、胃癌基因表达数据:本研究相关的胃癌数据全部来自于GEO (https://www.ncbi.nlm.nih.gov/geo/) 和TCGA (https://cancergenome.nih.gov/)。

2、16-mRNA特征挖掘及验证:通过使用R语言包“WGCNA” (weighted correlation network analysis)在实验数据集GSE62254中筛选到预后相关的680个基因,并通过“glmnet” package of R software 进行LASSO回归模型分析并验证16mRNA特征。

3、诺模图建立及评估:通过“rms”R包构建了诺模图和标定图,并通过“pROC”R包构建了ROC曲线以检测诺模图的准确性。

4、数据分析:相关数据分析使用了t检验,ROC分析,GSVA,PEC,单变量以及多变量Cox回归分析等方法。

三、结果

1、研究人员首先对实验数据集GSE62254进行Cox回归分析,确定与胃癌二、三期RFS(relapse‐free survival,RFS)相关的680个基因。随后,对这些基因进一步采用最小绝对收缩和选择算子的LASSOCOX回归分析(fig1a,b)。

图1. LASSOCOX回归分析胃癌二期三期相关的680个RFS基因

2、Kaplan-Meier生存曲线中位风险评分为临界值,将患者分为低风险组或高危组,结果表明,与低风险组相比,高危组预后较差,此结论在另外两个独立的数据集GSE26253和TCGA中也得到了一致验证。

图2. Kaplan-Meier生存曲线中位风险评分为临界值,将患者分为低风险组或高危组。

3、以风险评分、肿瘤分期、年龄和性别为协变量,采用单变量和多变量Cox回归分析,风险评分是二、三期GCS的独立危险因素。并且研究人员得到结论,三个数据集中风险评分均与RFS显著相关。

图3. 对三个数据集的风险评分、年龄、性别和肿瘤分期进行了单变量和多变量Cox回归分析

4、研究人员为了将分析结果更适用于临床,在GSE62254数据集中构建了整合16-mRNA标记、肿瘤分期、Lauren分类、淋巴结比率和化疗为一体的诺模图(fig4a),同时,通过标定图证明诺模图的良好性能(fig4b),通过基于诺模图的ROC曲线证明其预测准确性(fig4c),AOC曲线分析证明使用诺模图预测5年复发率会更有利于临床治疗方案的设计(fig4d)。

图4. 诺模图数据集中预测复发风险的诺模图。

5、研究人员为了寻找16-mRNA特征相关的基因集,对数据集GSE62254进行GSVA分析,发现高风险组中有许多转移和化疗耐药相关的基因组丰富(fig5a),并且16-mRNA特征标记与这些基因存在很强的正相性(fig5b)。

图5. 在数据集GSE62254中进行GSVA分析

四、结论

本文综合使用了绝对收缩和选择算子方法以及COX回归模型等经典的生信分析手段,挖掘到Ⅱ、Ⅲ期胃癌的新预后评估指标。在解决高维数据的处理方法中,此生信分析方法的综合使用不失为一张锦囊妙计。该研究没有做实验吧,图也很少,用的还都是公共数据库数据集😮为什么能发5.5呢?小编认为1、踩点:研究者有针对性的只分析Ⅱ、Ⅲ期胃癌样本,并不是全部样本都纳入分析;2、选数据集选的好:一般的分析都是用TCGA做分析,其它数据集做验证。该文章为什么反过来呢,大家可以看到图,因为TCGA P值相对较为不显著。所以,发文也没有大家想的那么难,有时候需要一点点的小心思文章就很不一样了。如果此刻你手里有一套有生存随访信息的数据,又恰好读到了我们的文章,还想做分析,哇塞(o゜▽゜)o☆发文妥妥的!有想法记得联系我们哦!!

相关文章

  • 发文——踩好点、选好数据很重要

    今天跟大家分享的是一月份发表在JOURNAL OF CELLULAR PHYSIOLOGY杂志(IF:5.55)上...

  • Mac搭建Hexo博客流程记录,排雷完成

    经过一天的辛苦作战,总算基础的东西出来了。踩了太多的坑,综合我踩坑的经过,明白到,选好一篇引导文很重要!有些步骤不...

  • 踩怎么就不行,简叔这政策得罪人?

    简叔有魄力,敢创新,符合民意,正本清源,何罪之有?! 不发文就没人踩,发文了我看不顺眼,文豪我都踩。 踩怎么就不行...

  • 4.7一念之间

    选好点位很重要,尝试了在百联扫商铺,也是突破吧。8点之前资源量都是垫底的,不想输给昨天的自己,不想给团队拖后腿。还...

  • 10.25

    选好队友很重要

  • 1116拥有不一定欢喜

    字数: 之前用的手机很卡,屏也摔裂了,想换个好点儿的手机很久了,但我有选择综合症,一到选择就犯难,选好点儿的吧,觉...

  • 定位(1)选好自己的发文时间

    币乎上VV们每天兢兢业业地产出内容,雄霸热门榜一方。但与此同时,也存在这么一种现象,真正精细化运作自己内容的仍在少...

  • 预大学生

    英语入学考试很重要,选好社团

  • 选好队友很重要

    大学是个很能培养人的协作能力的地方,记得在从小学到高中,多数时候还是自己去处理许多东西。团队的合作多是小组那种讨...

  • 数据分析:利用反馈,让文章越写越对!

    通过今天的课程,感受到原来数据这么重要!由此,今天分析了我公号的数据,和头条的数据。 1发文时间:通过数据,我知道...

网友评论

    本文标题:发文——踩好点、选好数据很重要

    本文链接:https://www.haomeiwen.com/subject/mnwjqktx.html