diamond比对以及结果数据处理

您所在的位置:网站首页 dimo怎么读 diamond比对以及结果数据处理

diamond比对以及结果数据处理

2024-01-30 02:06| 来源: 网络整理| 查看: 265

利用diamond比对数据

注意:diamond在无root权限的linux运行比对命令时需要加参数-t /dev/shm创建临时文件

#建库--in nr输入文件,--db nr 输出的数据库前缀 diamond makedb --in nr --db nr #比对 diamond blastx --db nr -q reads.fna -o dna_fmt6 diamond blastp --db nr -q reads.faa -o protein_fmt6

注意事项: 默认参数主要是针对段短序列,对于比较长的序列,使用--sensitive或--more-senstive提高敏感度。 默认的e-value阈值是0.001, 而BLAST是10,因此会比BLAST结果更加严格 性能优化: 设置比较低的-e参数 设置-k参数,减少输出的联配数目。这会降低临时文件大小和最终结果 --top会输出得分比最好的分数低一定百分比的结果, --compress 1: 输出结果会以gzip进行压缩 ———————————————— 原文链接:https://blog.csdn.net/u012110870/article/details/102804629 ———————————————— 有时间可以查查blastx和blastp的原理,它们会把预测的基因按照不同的数据框(应该是6种)读取然后比对 所以比对结果有许多重复的预测基因id,对应相同的数据库基因id和不同的E值,分数等。

(diamond结果和blast结果排列格式一样,有12列。以NCycDB为例)

因此我们需要对结果进行处理: 根据E值筛选(这个也可以在diamond参数里调整)一般是取小于0.0001或0.00001(1e-5) #第11列是E值,这里根据0.00001筛选 awk -F"\t" '$11


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3