使用TBtools进行本地blast并根据blast结果提取相关序列

您所在的位置:网站首页 如何查找基因序列号查询结果 使用TBtools进行本地blast并根据blast结果提取相关序列

使用TBtools进行本地blast并根据blast结果提取相关序列

2024-07-15 14:50| 来源: 网络整理| 查看: 265

TBtools 是一个集合了超多生信处理的小工具,非常方便,而且是无命令行的操作,入门门槛极低。开发者是华南农业大学陈程杰博士,TBtools文章地址:https://www.biorxiv.org/content/early/2018/03/27/289660 ,使用参考页面https://www.yuque.com/cjchen/hirv8i 最近要使用本地blast来寻找组内基因组的相似序列,所以准备使用tbtools来试试。

1.blast使用 1.1 数据库构建

参考网页https://zhuanlan.zhihu.com/p/418163788 首先打开软件界面,选择BLAST→BLAST GUI Wrapper→Blast Zone 会出现如下界面

image.png 然后在这个界面先构建一个本地的数据库,作为blast的数据库。 image.png 可以点击config按钮来设置数据库的存放位置。 image.png 点击图中的加号就可以添加本地的数据来构建数据库了。 image.png 点击确定之后一段时间完成数据库构建 image.png 如果要添加更多的数据库操作类似,删除数据库的话直接选中数据库然后选择 “-”就行了。 image.png image.png

1.2 使用序列进行BLAST

直接将需要BLAST的序列粘贴到input文本框中,选择好输出文件的格式、文件名和位置点击start就可以开始了(超短序列需要选择short mode)。

image.png

查看结果

image.png 结束之后,点击右下角的 Visulize 或TextView进行查看,Visulize有几种模式查看,点击之后在左上角出现图标选项,下拉选择之后再关掉就会出现显示的界面。 如选择Aligmemt Shorer会出现如下的结果 image.png

选择Dot Plot会出现如下结果:

选择Pileup Graph会出现如下结果 而使用TextView则会显示文本信息如下: image.png (Frame = -1则表示是反向序列)

这样就能看到BLAST所有结果的信息。

2. 根据Blast结果提取对应序列

提取对应序列需要使用tbtools中的Fasta Extract功能。

image.png

点击Sequence→Fasta tools→Fasta Extract (Recommended)进人Fasta Extract界面

image.png

从界面上来看,分为 6 大块,其中绝大多数是可选项(即可以不做调整)。

Fasta 序列文件输入文本框,用户可以直接拖拽硬盘中的 Fasta 文件并放置到文本框中,路径会自动获取;也可以点击跟随文本框的摁钮“...”,在弹出文件选择框中选取对应文件即可 Initialize 摁钮,在设置 Fasta 序列文件后,可以看到 Start 摁钮仍然不可点击。需要用户点击 Initialize 摁钮,创建 Fasta 序列索引文件(如前期已有,则会软件会自动复用,节省计算时间) 输出文件设置文本框,用户同样可以拖拽放置文件或者文件夹,程序会自动获取输出文件夹,用户需要补全一个输出文件名;当然也可以直接点击跟随文本框的摁钮,在弹出的问价选择框中设置对应输出文件即可 待提取序列信息设置框,参考界面说明,接受三种类型的提取模式: ● 基于 ID 的完整序列记录提取,如输入 Unigene_1 ... 等完整序列 ID,每行一个,即可提取完整序列记录 ● 基于 序列坐标信息,进行序列区间截取,如提取染色体 Chr1 上第 10000 个碱基到 20000 个碱基的一段序列,那么输入如下。如果需要提取反向互补序列,使起始坐标大于终止坐标即可。

# 注意,制表符[\t]分隔,而非空白[Space]分隔(试了下现在用空格好像也可以了) Chr1 10000 20000 # 提取反向互补序列,则翻转碱基坐标 Chr1 20000 10000

提取坐标信息的功能,重命名区间,如我们需要提取 Peak 或者 Promoter 序列信息,并指定输出时序列名字

peak_1 Chr1 10000 10200 promoter_ATG8 Chr2 20300 22300



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3