使用TBtools绘制进化树+motif分析+基因结构~三图合一

您所在的位置:网站首页 进化树的图怎么做 使用TBtools绘制进化树+motif分析+基因结构~三图合一

使用TBtools绘制进化树+motif分析+基因结构~三图合一

2023-10-01 03:12| 来源: 网络整理| 查看: 265

今天推文的内容重点是画图用到的输入文件的准备

image.png

图一

基因家族分析的论文中通常会把基因家族成员的进化树、基因结构、motif分析放在一张图里。效果如图一。准备这个图 除了把各部分画出来再使用ps将图片拼接起来以外,还可以用TBtools直接绘制这种效果的图片。其实绘制方法并不难,对于小白来说不友好的是准备绘图所需要的文件,本文旨在帮助像我一样刚入门的生信小白解决如何准备绘图文件的问题以及说明绘图过程中的一些注意点,希望对你有所帮助。

作图所需要的文件(本文重点)

作图前,有一点要注意的是:三个文件中序列的ID要修改统一。不统一的话会报错,导致绘图失败。然后继续说重点,如何准备绘图所需的三个文件。

1 准备nwk格式的进化树文件

MEGA构建进化树的结果文件:nwk文件,提供进化信息。这个文件准备比较容易。把蛋白质全长序列的fastA文件放入MEGA中中进行多序列比对,比对完成后保存为MEG类型文件。用MEG文件构建进化树,构建进化树结果保存为nwk类型即可。

2 MEME分析结果文件meme.xml

提供对应基因蛋白序列的motif结构信息。在Linux中安装MEME后,运行以下命令(如图二),我把命令的各部分解释给标记上了,可以根据需要灵活修改。这个命令的结果文件有好多个,找到xml文件(如图三)。

image.png

图二

image.png

图三

3 gff格式或者gtf格式的注释文件

这个文件的准备对我个人而言最具难度。所面临的问题是:如何从全基因组gff注释文件中把相关基因的注释文件提取出来保存并且保存为gff格式呢?

我在脑子里想了好多办法。

1.Notepad++中打开逐一筛选复制并保存。这个办法让我成功保存了一个txt格式的注释文件,可我要的是 gff类型的文件啊。 2.删除全基因组gff注释文件里的非目标基因的注释文件再保存…这办法,算了吧,我大学生应该还有办法。 3.自暴自弃,这图我不做了。

最后,我在之前学的一个基因家族相关课程里找到了一个perl脚本正符合我的需求!这个课程很不错,我自己跟着捣鼓了几遍后,对基因家族分析以及一些生信知识上有了基本的把握。由于我自己还没学过Perl脚本,只有一点python基础,以下运行命令(如图四)和脚本,只是根据课中老师的讲解和观察,知道了运行规律(如图四),总结分享给大家来解决自己的问题。懂Perl的同学可以灵活修改反复使用,不懂的可以像我一样,暂时先知道怎么用就行了。记住你每一个手动处理数据的痛苦时刻,然后变成学习复杂工具(python、perl等)的动力!

image.png

图四

image.png

图五

一定要注意的是:运行这个脚本一定要仔细观察你的物种注释文件中的ID,接下来我要以拟南芥的全基因组注释文件以及石榴的全基因组注释文件为例着重说明这一点,因为这关乎你是否能得到你想要的结果文件。请一定一定仔细看这一点!!!

石榴的gff注释文件(如图六)。再强调一下:图五红框内的每一个geneID和要和图六中对应gene的所有红框中的ID以及ParentID保持一致,对于我的石榴物种而已,也就是全把图六红框中的ID以及Parent全替换成绿框内的ID。因为脚本运行的规律就是:如果gff文件中的ID存在于图五红框内,就把该基因的mRNA、cds、UTR等序列信息行提取出来,提取出来的文件如图七。有些物种下载出来geneID就是保持一致的,比如拟南芥的(如图八、图九)。但是我研究的物种石榴就需要自己修改,这个你可以在Notepad++中搜索替换一下,这一步稍微麻烦点。

image.png

图六

image.png

图七

image.png

图八

image.png

图九

绘图方法

方法我是参考了组学大讲堂社区的文章来作图的,绘图过程并不是很难。具体可以点击以下链接参考学习。https://www.omicsclass.com/article/1269。 值得注意的是:我自己在作图过程中发现,文章中老师点击的位置(图十)和我下载的最新版本的TBtools的位置完全不一样,甚至名字都不一样,找了好半天,我估计应该是下载版本的问题。如果你也有这样的问题,可以参考下我这个版本的位置(如图十一),如果都不是的话,你就自己都点点看,点进去的界面(如图十二)即可。

image.png

图十

image.png

图十一

image.png

图十二

最后,如果你需要自定义最后呈现的图中进化树的序列ID(如图十三),那么TBtools支持你提交一个

image.png

图十三

原始的ID是基于进化树nwk文件提取获得,tbtools本身接收进行ID的批量修改,位于界面下方(图十四):

image.png

图十四

在红框栏提交一个文件,文件只需要保持TAB分隔的文本文件,第一列是原始ID,第二列是新ID,不需要表头,即可完成批量修改。

本期推文的内容是读者来稿 由小明进行编辑整理

欢迎大家关注我的公众号 小明的数据分析笔记本



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3