diamond & blast:DNA蛋白序列比对

您所在的位置:网站首页 dna比对是什么意思 diamond & blast:DNA蛋白序列比对

diamond & blast:DNA蛋白序列比对

2024-01-24 02:02| 来源: 网络整理| 查看: 265

导读

用query基因、DNA序列、16S扩增子序列、蛋白序列比对基因注释、物种注释 、基因功能注释数据库。Blast准确性高,速度慢。Diamond速度更快,常用于二代测序短序列比对。

一、Diamond blastp

Diamond blastx功能可用于DNA序列比对【蛋白库】

【核酸】比对【蛋白库】

diamond blastx \ --db /path/to/protein.dmnd \ --query /path/to/genome.fna \ -e 1e-5 --outfmt 6 --more-sensitive --max-target-seqs 1 --threads 52 --quiet --id 80 --subject-cover 50 --query-cover 50 \ --out /path/to/anno.txt

【蛋白】比对【蛋白库】

diamond格式化蛋白库 diamond makedb -p 52 \ --in /path/to/protein.fasta \ --db /path/to/protein.dmnd query比对格式化蛋白库 paraments blastp 比蛋白 blastx 比核酸 blastp Align amino acid query sequences against a protein reference database blastx Align DNA query sequences against a protein reference database --query-cover minimum query cover% to report an alignment --subject-cover minimum subject cover% to report an alignment --out (-o) 输出 --query (-q) 输入 --db (-d) 格式化数据库 --in Fasta数据库 --quiet 安静模式 --verbose (-v) 啰嗦模式 --outfmt (-f) 输出格式 5 = BLAST XML 6 = BLAST tabular 100 = DIAMOND alignment archive (DAA) 101 = SAM --top / --max-target-seqs 保留个数 --evalue (-e) 最大evalue --id 最小一致性 --sensitive 敏感模式 (default: fast) --more-sensitive 更敏感模式 (default: fast) --block-size (-b) sequence block size in billions of letters (default=2.0) --index-chunks (-c) number of chunks for index processing command diamond blastp \ --db /path/to/protein.dmnd \ --query /path/to/genome.faa \ -e 1e-5 --outfmt 6 --more-sensitive --max-target-seqs 1 --threads 52 --quiet --id 60 \ --out /path/to/anno.txt

Diamond比对结果

1. qseqid | query sequence id 2. sseqid | subject sequence id 3. pident | percentage of identical matches 4. length | alignment length 5. mismatch | number of mismatches 6. gapopen | number of gap openings 7. q start | start of alignment in query 8. q end | end of alignment in query 9. s start | start of alignment in subject 10. s end | end of alignment in subject 11. evalue 12. bitscore

e value解读

二、Blastn & Blastp

Blastn【基因】比对【基因库】

注释信息可以是物种,也可以是功能,比对就O了

blast格式化数据库 makeblastdb -in database.fna \ -input_type fasta -dbtype nucl -title prefix -parse_seqids \ -out /path/to/prefix

-dbtype -input_type -title Title for BLAST database -parse_seqids Option to parse seqid for FASTA input -out Name of BLAST database to be created

query比对格式化数据库 blastn -db /path/to/prefix \ -query /path/to/query.fasta \ -outfmt 6 \ -out /path/to/qcov80_id80_blast.out \ -num_threads 64 -perc_identity 80 -qcov_hsp_perc 80

-max_target_seqs: Maximum number of aligned sequences to keep. Default = 500 -evalue: E值就是Score值可靠性的评价。 它表明在随机的情况下,其它序列与目标序列相似度要大于S值的可能性。所以它的分值越低越好。 -perc_identity: 序列一致性 -qcov_hsp_perc Percent query coverage per hsp。HSP是high scoring pair

Blastp【蛋白】比对【蛋白库】

blast格式化数据库 makeblastdb -in /path/to/pro.fas \ -input_type fasta -dbtype prot -title blastn_pro \ -out /path/to/blastn_pro -parse_seqids query比对格式化数据库 blastp -db /path/to/blastn_pro \ -query query.faa \ -out blast_pro.out \ -num_threads 52 -qcov_hsp_perc 80 -outfmt 6 \ -evalue 1e-5 -num_alignments 1

Blast比对结果

1、Query id:查询序列ID标识 2、Subject id:比对上的目标序列ID标识 3、% identity:序列比对的一致性百分比 4、alignment length:符合比对的比对区域的长度 5、mismatches:比对区域的错配数 6、gap openings:比对区域的gap数目 7、q start:Query id起始位点 8、q end:Query id终止位点 9、s start:Subject id起始位点 10、s end:Subject id终止位点 11、e value:比对结果的期望值 12、bit score:比对结果的bit score值

https://github.com/bbuchfink/diamond/wiki

The sensitivity can be adjusted using the options: --mid-sensitive, --sensitive, --more-sensitive, --very-sensitive, --ultra-sensitive.

Diamond 比对软件使用 The default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 10, so by default the program will search a lot more stringently than BLAST and not report weak hits.

三、比对软件默认取值 prokka

https://github.com/tseemann/prokka/blob/master/README.md

--evalue [n.n] Similarity e-value cut-off (default '1e-06')

default '1e-06'

diamond default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 10

1e-3

blast default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 10

10

kofamscan -E, --e-value Largest E-value required of the hits

亲自测试是 1e-3

😀😀



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3