转录组功能分析数据库及富集分析

您所在的位置:网站首页 GSVA基因集都选什么 转录组功能分析数据库及富集分析

转录组功能分析数据库及富集分析

#转录组功能分析数据库及富集分析| 来源: 网络整理| 查看: 265

一、KEGG

1、http://www.genome.jp/kegg/,京都基因与基因组百科全书;某基因、转录本参与的具体生物学通路情况

2、分类

3、KEGG详细解读:

各功能模块描述

一文快速读懂 KEGG 数据库与通路图 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/96008506

通路查询

 如何从KEGG数据库找到想要的通路? - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/401700324

4、运用:基因集GSEA分析,差异基因KEGG功能富集分析 

 二、GO

1、GO/Gene Ontology 基因本体论, http://www.geneontology.org,由基因本体论联合会建立,对基因、蛋白功能进行统一限定和描述。通过GO富集分析可粗略了解基因富集在哪些生物学功能、途径或细胞定位。

2、分类:

BP:Biological Process,生物过程

MF:Molecular Function,分子功能

CC:Cellular Component,细胞组分

三、Hallmark geneset 效应特征基因集:该类别包含多个已知基因集构成的超基因集,每个类别的基因集都对应多个基础的其他类别的基因集。

四、运用:基因集GSEA、GSVA,差异基因功能富集分析,单细胞佐证亚群分群

上述基因集都在MSigDB数据库中,也是进行GSEA的必用基因集数据库

GSEA官网:GSEA | Login (gsea-msigdb.org)http://www.gsea-msigdb.org/gsea/login.jsp;jsessionid=F4F18E65C6B7F24A66CF1B9A3393165DMSigDB数据库介绍

GSEA分析是个什么鬼?(上) (360doc.com)http://www.360doc.com/content/16/1026/18/19913717_601568937.shtml六、GSEA基因集富集分析

1、富集分析及原理:

生物过程通常由一组基因参与,若生物过程发生异常,则相关基因组成与这一过程相关的基因集合。富集分析比较基因集在某个功能上相比随机水平是否发生过出现现象(over-presentation),显示此生物功能大体上下调趋势,其无法显示基因上下调趋势

其输入数据包含两部分,一是已知功能的基因集 (GO、MsigDB注释或其它符合格式的基因集定义),一是表达矩阵或按照某种方式排序好的基因列表,对基因根据其与表型的关联度(可以理解为表达值的变化)从大到小排序,然后判断基因集内的基因是否富集于表型相关度排序后基因表的上部或下部,从而判断此基因集内基因的协同变化对表型变化的影响。RANK METRIC SCORE是基因排序评分,可以理解为表达值变化大小,可以用来代表基因与表型相关性。

2、与传统GO/KEGG富集分析比较:GO/KEGG富集先筛差异基因,再判断差异基因在哪些通路富集,涉及阈值设定,存在一定主观性且只能用于表达变化较大的基因,而GSEA不局限于差异基因,是从基因集的富集角度出发

3、R实现

######################################################NGS GSEA ##整理数据 select.FPKM 10) #初筛样本表达基因 rownames(res2) degs.list=as.character(res2$symbol)[select.FPKM] #提取res2 基因名列符合筛选条件的基因名 res3=distinct(res2,symbol,.keep_all = T) #去重 rownames(res3)=res3$symbol #行名变为基因名 f1=res3[degs.list,] #提取筛选后基因名的行 exp.fc=f1[,c(2,4)] #提取基因名列及FC值列 ##id转化并按FC降序排列 expm.id


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3