cdhit工具的使用方法

您所在的位置:网站首页 kbu2510使用方法 cdhit工具的使用方法

cdhit工具的使用方法

2024-02-14 02:27| 来源: 网络整理| 查看: 265

cd-hit:

是一种贪婪的增量聚类方法,首先对输入的序列根据序列的长短进行排序,并从最长到最短的顺序处理它们。将最长的序列自动的分为第一类并作为第一类的代表序列,然后将剩下的序列与在其之前发现的代表性序列进行比较,根据序列相似性将其归为其中的一类或成为新的一个聚类的代表序列,如此遍历所有序列完成聚类过程。 在默认方式中,序列仅和每一个聚类中的代表性序列(为这类中的最长序列)进行比较而不和这个类中的其他序列进行比对。 在准确模式下,序列会和每个聚类中的所有序列进行比较然后决定是成为新的一类还是归为其中的一类中。

安装:

最新的版本:

Releases · weizhongli/cdhit (github.com)

下载地址:版本是:cd-hit-v4.6.8-2017-1208

https://github.com/weizhongli/cdhit

wget https://github.com/weizhongli/cdhit/releases/download/V4.6.8/cd-hit-v4.6.8-2017-1208-source.tar.gz #下载cd-hit tar -zxvf cd-hit-v4.6.8-2017-1208-source.tar.gz #解压 cd cd-hit-v4.6.8-2017-1208 make #编译 cd cd-hit-auxtools make #编译 #如果编译失败,可以下载二进制版本,解压就可以使用不用编译 wget https://github.com/weizhongli/cdhit/releases/download/V4.6.7/cd-hit-v4.6.7-2017-0501-Linux-binary.tar.gz #解压即用,不用编译

在Liunx环境中进行环境变量的配置:  

首先输入命令: vim ~/.bashrc 在然后加入(输入你将文件夹放入的目录;可以使用pwd查看) export PATH=/opt/cd-hit-v4.6.8-2017-1208:$PATH 保存,并运行 然后输入命令: source ~/.bashrc配置:我将压缩放到/opt目录下 使用:

包说明:

* cd-hit Cluster peptide sequences * cd-hit-est Cluster nucleotide sequences * cd-hit-2d Compare 2 peptide databases * cd-hit-est-2d Compare 2 nucleotide databases * psi-cd-hit Cluster proteins at cd-hit -i pos.fasta -o pos40.fasta -c 0.4 -n 2 第二步对正负样本对比进行去重的操作: > cd-hit-2d -i pos.fasta -i2 neg.fasta -o neg40_1.fasta -c 0.4 -n 2 第三步将得到负样本自己再进行去重的操作: > cd-hit -i neg40_1.fasta -o neg40.fasta -c 0.4 -n 2



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3