第3篇:用MACS2软件call peaks

您所在的位置:网站首页 peak中文名 第3篇:用MACS2软件call peaks

第3篇:用MACS2软件call peaks

2024-01-17 03:31| 来源: 网络整理| 查看: 265

学习目标: 学会用MACS2 call peaks 理解MACS2 call peaks的结果 Peak Calling

Peak calling即利用计算的方法找出ChIP-seq或ATAC-seq中reads富集的基因组区域。

如下图所示,比对结果的文件中reads在正负链不均匀分布,但在结合位点聚集。正负链5‘末端的reads各形成一组合,通过统计学的方法评估这些组合的分布并和对照组比较,确定这些结合位点是否是显著的。

NOTE:ChIP-seq的分析方法可以鉴定两种类型的富集模式:broad domains和narrow peaks。broad domains,如组蛋白修饰在整个基因body区域的分布;narrow peak,如转录因子的结合。narrow peak相对于broad 或者分散的marks更易被检测到。也有一些混合的结合图谱,如PolII包括narrow和broad信号。

MACS2

peaks calling 有不同的方法,MACS2是最常用的call peaks工具。 MACS全称Model-based Analysis of ChIP-Seq,最初的设计是用来鉴定转录因子的结合位点,但是它也可以用于其他类型的富集方式测序。 MACS通过整合序列标签位置信息和方向信息提高结合位点的空间分辨率。MACS的工作流如下所示:

MACS2的使用方法

MACS2的用法,call peaks的参数及输出文件的解读可以参考MACS2文档学习。

了解相关参数:

输入文件参数:

-t:实验组,IP的数据文件 c: 对照组 f:指定输入文件的格式,默认是自动检测输入数据是什么格式,支持bam,sam,bed等 g:有效基因组大小,由于基因组序列的重复性,基因组实际可以mapping的大小小于原始的基因组。这个参数要根据实际物种计算基因组的有效大小。软件里也给出了几个默认的-g 值:hs -- 2.7e9表示人类的基因组有效大小(UCSC human hg18 assembly). hs: 2.7e9 mm: 1.87e9 ce: 9e7 dm: 1.2e8

输出文件参数:

--outdir:输出结果的存储路径 --n:输出文件名的前缀 -B/--bdg:输出bedgraph格式的文件,输出文件以NAME+'_treat_pileup.bdg' for treatment data, NAME+'_control_lambda.bdg' for local lambda values from control显示。

peak calling 参数

-q/--qvalue 和 -p/--pvalue q value默认值是0.05,与pvalue不能同时使用。 --broad peak有narrow peak和broad peak, 设置时可以call broad peak 的结果文件。 --broad-cutoff 和pvalue、以及qvalue相似 --nolambda: 不要考虑在峰值候选区域的局部偏差/λ

q值与峰宽有一定的联系。理想情况下,如果放宽阈值,您将简单地获得



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3