diamond & blast:DNA蛋白序列比对 |
您所在的位置:网站首页 › dna比对是什么意思 › diamond & blast:DNA蛋白序列比对 |
导读
用query基因、DNA序列、16S扩增子序列、蛋白序列比对基因注释、物种注释 、基因功能注释数据库。Blast准确性高,速度慢。Diamond速度更快,常用于二代测序短序列比对。 一、Diamond blastpDiamond blastx功能可用于DNA序列比对【蛋白库】 【核酸】比对【蛋白库】 diamond blastx \ --db /path/to/protein.dmnd \ --query /path/to/genome.fna \ -e 1e-5 --outfmt 6 --more-sensitive --max-target-seqs 1 --threads 52 --quiet --id 80 --subject-cover 50 --query-cover 50 \ --out /path/to/anno.txt【蛋白】比对【蛋白库】 diamond格式化蛋白库 diamond makedb -p 52 \ --in /path/to/protein.fasta \ --db /path/to/protein.dmnd query比对格式化蛋白库 paraments blastp 比蛋白 blastx 比核酸 blastp Align amino acid query sequences against a protein reference database blastx Align DNA query sequences against a protein reference database --query-cover minimum query cover% to report an alignment --subject-cover minimum subject cover% to report an alignment --out (-o) 输出 --query (-q) 输入 --db (-d) 格式化数据库 --in Fasta数据库 --quiet 安静模式 --verbose (-v) 啰嗦模式 --outfmt (-f) 输出格式 5 = BLAST XML 6 = BLAST tabular 100 = DIAMOND alignment archive (DAA) 101 = SAM --top / --max-target-seqs 保留个数 --evalue (-e) 最大evalue --id 最小一致性 --sensitive 敏感模式 (default: fast) --more-sensitive 更敏感模式 (default: fast) --block-size (-b) sequence block size in billions of letters (default=2.0) --index-chunks (-c) number of chunks for index processing command diamond blastp \ --db /path/to/protein.dmnd \ --query /path/to/genome.faa \ -e 1e-5 --outfmt 6 --more-sensitive --max-target-seqs 1 --threads 52 --quiet --id 60 \ --out /path/to/anno.txtDiamond比对结果 1. qseqid | query sequence id 2. sseqid | subject sequence id 3. pident | percentage of identical matches 4. length | alignment length 5. mismatch | number of mismatches 6. gapopen | number of gap openings 7. q start | start of alignment in query 8. q end | end of alignment in query 9. s start | start of alignment in subject 10. s end | end of alignment in subject 11. evalue 12. bitscoree value解读 二、Blastn & BlastpBlastn【基因】比对【基因库】 注释信息可以是物种,也可以是功能,比对就O了 blast格式化数据库 makeblastdb -in database.fna \ -input_type fasta -dbtype nucl -title prefix -parse_seqids \ -out /path/to/prefix-dbtype -input_type -title Title for BLAST database -parse_seqids Option to parse seqid for FASTA input -out Name of BLAST database to be created query比对格式化数据库 blastn -db /path/to/prefix \ -query /path/to/query.fasta \ -outfmt 6 \ -out /path/to/qcov80_id80_blast.out \ -num_threads 64 -perc_identity 80 -qcov_hsp_perc 80-max_target_seqs: Maximum number of aligned sequences to keep. Default = 500 -evalue: E值就是Score值可靠性的评价。 它表明在随机的情况下,其它序列与目标序列相似度要大于S值的可能性。所以它的分值越低越好。 -perc_identity: 序列一致性 -qcov_hsp_perc Percent query coverage per hsp。HSP是high scoring pair Blastp【蛋白】比对【蛋白库】 blast格式化数据库 makeblastdb -in /path/to/pro.fas \ -input_type fasta -dbtype prot -title blastn_pro \ -out /path/to/blastn_pro -parse_seqids query比对格式化数据库 blastp -db /path/to/blastn_pro \ -query query.faa \ -out blast_pro.out \ -num_threads 52 -qcov_hsp_perc 80 -outfmt 6 \ -evalue 1e-5 -num_alignments 1Blast比对结果 1、Query id:查询序列ID标识 2、Subject id:比对上的目标序列ID标识 3、% identity:序列比对的一致性百分比 4、alignment length:符合比对的比对区域的长度 5、mismatches:比对区域的错配数 6、gap openings:比对区域的gap数目 7、q start:Query id起始位点 8、q end:Query id终止位点 9、s start:Subject id起始位点 10、s end:Subject id终止位点 11、e value:比对结果的期望值 12、bit score:比对结果的bit score值 https://github.com/bbuchfink/diamond/wiki The sensitivity can be adjusted using the options: --mid-sensitive, --sensitive, --more-sensitive, --very-sensitive, --ultra-sensitive.Diamond 比对软件使用 The default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 10, so by default the program will search a lot more stringently than BLAST and not report weak hits. 三、比对软件默认取值 prokkahttps://github.com/tseemann/prokka/blob/master/README.md --evalue [n.n] Similarity e-value cut-off (default '1e-06')default '1e-06' diamond default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 101e-3 blast default e-value cutoff of DIAMOND is 0.001 while that of BLAST is 1010 kofamscan -E, --e-value Largest E-value required of the hits亲自测试是 1e-3 😀😀 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |