maftools

您所在的位置:网站首页 2024数二真题解析 maftools

maftools

2024-02-08 20:23| 来源: 网络整理| 查看: 265

之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。

本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现,本次使用TCGA下载的LIHC数据。

数据部分

#载入R包和数TCGA-LIHC的maf数据 library(maftools) laml.maf = read.csv("TCGA.LIHC.mutect.maf.csv",header=TRUE) #本次只展示maf的一些统计绘图,只读入组学数据,不添加临床数据 laml = read.maf(maf = laml.maf) #查看数据的基本情况 laml An object of class MAF ID summary Mean Median 1: NCBI_Build 1 NA NA 2: Center 1 NA NA 3: Samples 364 NA NA 4: nGenes 12704 NA NA 5: Frame_Shift_Del 1413 3.893 3 6: Frame_Shift_Ins 551 1.518 1 7: In_Frame_Del 277 0.763 0 8: In_Frame_Ins 112 0.309 0 9: Missense_Mutation 28304 77.972 63 10: Nonsense_Mutation 1883 5.187 4 11: Nonstop_Mutation 45 0.124 0 12: Splice_Site 1051 2.895 2 13: Translation_Start_Site 65 0.179 0 14: total 33701 92.840 75

#可以将MAF文件的gene ,sample的 summary 的信息,输出到laml前缀的summary文件

write.mafSummary(maf = laml, basename = 'laml')

laml_geneSummary.txt

laml_sampleSummary.txt

分析,可视化

1,绘制MAF文件的整体结果图

plotmafSummary(maf = laml, rmOutlier = TRUE, addStat = 'median', dashboard = TRUE, titvRaw = FALSE)

2,绘制oncoplot图

#oncoplot for top 20 genes. oncoplot(maf = laml, top = 20)

添加SCNA信息,添加P值信息,添加临床注释信息,更改颜色等可参考 maftools | 从头开始绘制发表级oncoplot(瀑布图)

3,绘制Oncostrip

可以使用 oncostrip 函数展示特定基因在样本中的突变情况,此处查看肝癌中关注较多的'TP53','CTNNB1', 'ARID1A'三个基因,如下:

oncostrip(maf = laml, genes = c('TP53','CTNNB1', 'ARID1A'))4 Transition , Transversions

titv函数将SNP分类为Transitions_vs_Transversions,并以各种方式返回汇总表的列表。汇总数据也可以显示为一个箱线图,显示六种不同转换的总体分布,并作为堆积条形图显示每个样本中的转换比例。

laml.titv = titv(maf = laml, plot = FALSE, useSyn = TRUE) #plot titv summary plotTiTv(res = laml.titv)5 Rainfall plots

使用rainfallPlot参数绘制rainfall plots,展示超突变的基因组区域。detectChangePoints设置为TRUE,rainfall plots可以突出显示潜在变化的区域.

rainfallPlot(maf = laml, detectChangePoints = TRUE, pointSize = 0.6)6 Compare mutation load against TCGA cohorts

通过tcgaComapre函数实现laml(自有群体)与TCGA中已有的33个癌种队列的突变负载情况的比较。

#cohortName 给输入的队列命名 laml.mutload = tcgaCompare(maf = laml, cohortName = 'LIHC-2')7 Genecloud

使用 geneCloud参数绘制基因云,每个基因的大小与它突变的样本总数成正比。

geneCloud(input = laml, minMut = 15)8 Somatic 交互性

癌症中的许多引起疾病的基因共同发生或在其突变模式中显示出强烈的排他性。可以使用somaticInteractions函数使用配对Fisher 's精确检验来分析突变基因之间的的co-occurring 或者exclusiveness。

#exclusive/co-occurance event analysis on top 10 mutated genes. Interact


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3