我们作比对时经常用到blast,其比对结果一般都用m8格式(即参数是 -m 8,blast+是 -outfmt 6),但是结果文件中是没有表头的,这里来写一下。
GRMZM2G356204_P01 Zm00008a018958_P01 98.23 620 0 1 121 740 31 639 0.0 1176GRMZM2G356204_P01 Zm00008a000413_P01 99.15 355 3 0 364 718 1 355 0.0 742GRMZM2G054378_P01 Zm00008a018960_P01 82.47 308 0 2 1 308 1 254 3e-175 508GRMZM2G054378_P01 Zm00008a000414_P01 69.48 308 39 4 1 308 1 253 7e-137 409GRMZM2G054378_P01 Zm00008a010407_P01 98.82 169 2 0 498 666 576 744 3e-101 337GRMZM2G054378_P01 Zm00008a027044_P01 95.27 169 8 0 498 666 576 744 1e-95 321GRMZM2G054378_P01 Zm00008a036759_P01 97.32 149 4 0 498 646 79 227 3e-93 294GRMZM2G054378_P02 Zm00008a018960_P01 82.47 308 0 2 1 308 1 254 3e-175 508GRMZM2G054378_P02 Zm00008a000414_P01 69.48 308 39 4 1 308 1 253 8e-137 409GRMZM2G054378_P02 Zm00008a010407_P01 98.82 169 2 0 498 666 576 744 3e-101 337
上面是blast的比对结果,一共有12 列,分别代表:
1、Query id:查询序列ID标识
2、Subject id:比对上的目标序列ID标识
3、% identity:序列比对的一致性百分比
4、alignment length:符合比对的比对区域的长度
5、mismatches:比对区域的错配数
6、gap openings:比对区域的gap数目
7、q. start:比对区域在查询序列(Query id)上的起始位点
8、q. end:比对区域在查询序列(Query id)上的终止位点
9、s. start:比对区域在目标序列(Subject id)上的起始位点
10、s. end:比对区域在目标序列(Subject id)上的终止位点
11、e-value:比对结果的期望值
12、bit score:比对结果的bit score值
一般情况我们看第3、11、12两列,e值越小越可靠。
|