6分+纯生信!用多个公共数据集+超全面的常用生信方法综合分析挖掘关键基因,生信小白

您所在的位置:网站首页 分析基因表达的方法有哪些种类 6分+纯生信!用多个公共数据集+超全面的常用生信方法综合分析挖掘关键基因,生信小白

6分+纯生信!用多个公共数据集+超全面的常用生信方法综合分析挖掘关键基因,生信小白

2024-07-10 23:53| 来源: 网络整理| 查看: 265

之前发了很多篇关于机器学习挖掘关键基因的,今天换换口味纯生信,基本上常用的生信方法全都在这篇文章里了。

up今天带来的这篇文章干货满满,生信综合分析去挖掘关键的基因,挺暴力的就是硬干,用了9个数据集算是比较多的了,整篇文章对数据的挖掘是相当充分,但是方法都是大家熟知的(ps:要活用这些分析方法,原理一定要搞懂)结果的可信度也是比较高的,为临床诊断提供了重要的参考。(ps:想发生信文章的快上车,关注小记者,这里你要的全都有!)

题目:食管癌转录组分析挖掘癌症进展的中枢基因和网络

杂志:Computers in Biology and Medicine

影响因子:IF=6.698

发表时间:2023年5月

研究背景

食管癌(Esophageal carcinoma,ESCA)是一种普遍的恶性肿瘤,长期以来一直是公共卫生方面的重要问题。随着高通量技术的不断发展,越来越多的不同分析方法被应用于食管癌的研究中。以往的方法主要依赖于基因芯片和单测序,但这些方法存在一些局限性。目前需要综合多种方法,更全面地探究食管癌的病理学特征,以期发现可靠的分子标志物。

数据来源

研究思路

本研究旨在通过各种分析方法,鉴定与食管癌相关的关键基因,为临床诊断和治疗提供新的选择。本文运用了多种分析方法,包括差异表达分析、蛋白质相互作用网络分析、GO和KEGG通路富集分析、甲基化和基因拷贝数分析、生存分析以及miRNA和转录因子分析等。分析鉴定出4个关键基因(RORA,KAT2B,CDC25B和ECT2),这些基因在食管癌的发展和预后中发挥重要作用。

图1工作流程图

主要结果

1. 差异表达基因 (DEG) 鉴定

作者在GSE164158、GSE38129、GSE26886、GSE20347和GSE17351中识别出1718、1223、8226、1716和744个DEG。为了识别EAC(Esophageal Adenocarcinoma, 食管腺癌)中重要DEG,在GSE92366、GSE26886和GSE1420中筛选了1653、8217和1734个DEG。对GSE111044数据集进行了检查,并探索了SCEC中的5585个重要的DEG。图2A显示了三种不同亚型食管癌共有DEG。本研究共发现20种常见的DEG。在这些DEG中,16个基因在所有食管癌类型(EAC、ESCC(Esophageal Squamous Cell Carcinoma, 食管鳞状细胞癌)和SCEC(Small Cell Esophageal Carcinoma, 小细胞食管癌))中上调,3个基因下调。分析中发现LAMC2基因同时上调(ESCC和EAC)和下调(SCEC)。因此,基因被分为两类(上调和下调基因)。图2B展示了基因表达数据集共有的DEG。PCA分析表明,ESCA患者可以与健康个体有效区分开来(图2C)。

图2 DEGs和GO分析结果图

2.GO分析和KEGG通路分析

作者使用Enrichr进行富集分析。发现上调基因富集于调节细胞迁移、蛋白质自泛素化、信号转导正调控等生物过程(图3A-B)。对于细胞成分,这些基因在内质网膜、肌动蛋白细胞骨架中富集(图3C)。上调基因的KEGG通路分析表明,这些基因主要参与notch信号通路等(图3D)。发现下调基因参与基本生物过程,如有丝分裂细胞周期调节等(图4A),及分子功能,如GTPase调节活性和蛋白酪氨酸磷酸酶活性(图4C)。细胞成分方面,这些下调基因主要富集在有丝分裂纺锤体、细胞-细胞连接和核膜中(图4D)。KEGG通路分析表明,这些下调基因主要负责细胞周期和MAPK信号通路(图4B)。富集分析将这些差异表达的基因鉴定为关键基因。

 

图3 上调 DEG 的GO和KEGG通路分析

 

图4下调 DEG 的GO和KEGG通路分析

3. PPI网络分析与hub基因检测

作者通过DEG构建PPI网络,由168个节点和173条边组成。度≥8的被认为是中枢基因。结果表明,RORA、CDC25B、ECT2和KAT2B可能是hub蛋白发挥作用的节点(图5)。作者通过观察它们在不同癌症类型中的表达并进行PCA分析,评估了这些中枢基因的作用。PCA分析表明,这些中枢基因可以显着区分癌症患者和健康个体(图5B)。

图5 PPI网络以及PCA结果

4. 中枢基因验证

表达分析表明,CDC25B和ECT2在大多数癌症类型中上调,而RORA和KAT2B在某些癌症类型中略微下调。作者发现这些基因与不同癌症类型的总生存率和无病生存率相关(图6)。所以这些中枢基因会影响癌症患者的生存能力,并可能有助于确定导致该疾病的新途径或分子机制。

图6中枢基因在其他类型癌症中的表达结果

5. hub基因甲基化及基因拷贝数分析

作者使用TCGA队列对4个中枢基因进行甲基化研究,挖掘出甲基化与mRNA表达之间的相关性。结果表明,和正常组织相比,上调的KAT2B和RORA hub基因具有更高的甲基化水平,而下调的CDC25B和ECT2具有更低的甲基化水平(图7A-D)。相关性分析表明甲基化水平与mRNA表达呈负相关,表明甲基化程度可能涉及调节这些中枢基因的表达(图7E-H)。作者还研究了基因拷贝数与4个hub基因mRNA表达水平之间的相关性,结果显示所有hub基因的mRNA表达与基因拷贝数呈正相关,这表明基因拷贝数也可能具有控制这些基因表达的作用(图8A-D)。之后观察在不同等级ESCA癌组织的中枢基因甲基化(图8E-H)。因此,这些中枢基因的甲基化状态可用于评估ESCA癌症患者的预后。

图7 中枢基因的甲基化和基因拷贝数分析 

图8基因拷贝数与mRNA表达的相关性分析

7. Hub基因与白细胞介素和免疫细胞浸润的相关性分析

作者对hub基因的表达量与IL-6、IL-33进行相关性分析,进一步评估hub基因的作用。分析表明,所有hub基因均与IL-33的升高呈正相关,而只有RORA和KAT2B与IL-6呈正相关(图9)。因此,hub基因表达增加可能与IL-33表达增加有关,而RORA和KAT2B表达增加也可能导致IL-6表达增加。在对免疫细胞浸润和hub基因表达水平进行相关性分析后,观察到所有hub基因均受到至少两个免疫细胞浸润水平的正调控(图10)。

图9 食管癌hub基因与IL-33、IL-6的相关性分析

图10 中枢基因水平与 ESCA组织中免疫细胞浸润之间的相关性

8. Hub基因在 ESCA 癌症分期和生存分析中的表达

TCGA ESCA队列的表达分析表明,这些hub基因的表达也与个体癌症阶段相关(图11A-D)。生存分析表明,高RORA、KAT2B和ECT2表达与ESCA患者较差的总生存期(OS)相关,而CDC25B基因低表达与较低的OS相关(图11E-H)

图11 ESCA 患者基因表达与癌症分期之间关联的分析

文章小结

这篇文章分析思路很明确,就是用所有能用的方法充分挖掘信息,主要亮点就是综合多种分析方法来揭示食管癌的复杂性,具有较高的创新性和实用性。本文的工作量较大,但随着高通量技术的发展,这一方法越来越成熟和常见(ps:文章不足的一点就是图片的dpi不是很高,原文看着不是很清晰推荐大家用300dpi以上的,图的质量高也容易发高分期刊哟!) 。大家就可以找个热点的疾病然后同样的操作挖掘你想挖掘的。(ps:小记者将持续推送优质文章,赶快关注小记者吧!)



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3