Blast结果的详细解析

要使用程序对blast结果进行解析、分析,就必须对BLAST的结果形式有深入的了解,本篇文章将向你详细说明Blast结果的数据结构,供参考。这里的指的是blast默认的结果,也是我们应用最多的结果。

3.14.1. 结果文件的结构

一个BLAST的结果文件,大致结构如下:
每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Reference信息。接下来包含一个或多个Query,每个query包含以下内容:
Query information
Sequences producing significant alignments
Subjects
Query information是对一个query 序列的基本信息描述,Sequences producing significant alignments是对所有subjects的简要list。每个subjects是query序列在数据库中比对上的一条序列。

3.14.2. header

每个blast结果文件都以固定的header开头,里面包含了BLAST程序名称,版本与Reference信息。

blast结果解读-header

blast结果解读-header

3.14.3. Query

每个blast结果文件包含一个或多个Query,每个query包含以下内容:
Query information
Sequences producing significant alignments
Subjects

blast结果解读-Query

blast结果解读-Query

3.14.4. Query information

Query information是对一个query 序列的基本信息描述。该部分包括
 Name:Fasta序列对于序列描述的部分(见本文档section1.2部分说明)
 Accession:接收号,或者location
 Description:序列描述
 Length:序列的长度
 Database:用户使用的数据库信息

3.14.5. Sequences producing significant alignments

该处的信息是所有subjects的简要list。

blast结果解读-subjects list

blast结果解读-subjects list

3.14.6. Subjects

每个subjects是query序列在数据库中比对上的一条序列。每个subject部分包括
 Subject序列信息
 一个或多个alignment

3.14.7. Subject序列信息

Subject序列信息包括该序列的:
 Name:Fasta序列对于序列描述的部分
 Accession:接收号,或者location
 Description:序列描述
 Length:序列的长度

BLAST-subjects

BLAST-subjects

3.14.8. Alignment

一个query序列和一个subject序列的比对结果,可能是一个或多个alignment,每个alignment包括如下信息,其中strand,frame和positives三项,随着所用blast程序的不同而有变动:
 Score:281
 Expect:2e-54
 Percent_identity
 Identities
 bits :110
 Length
 Mismatches= Length – Identities
 Gaps:为空时,Gaps=0
 Strand (blastn)
 Frame (blastx,tblastn,tblastx)
 Positives (blastp, blastx,tblastn,tblastx)
 Query_start
 Query_end
 Subject _start
 Subject _end

BLAST-subjects

BLAST-subjects

3.14.9. 数据结构总结

比对结果分三个层次
Query下面有一个或者多个Subject,一个Subject下面有多个Alignments。
Query 从“Query=” 开始到下一个 “Query=”或者文件结束
Subject 从“>”开始到下一个“>”或者“Query=”或者文件结束
Alignment 从“Score =”开始到下一个“Score =”或“>”或者“Query=”或者文件结束。

BLAST-数据结构

BLAST-数据结构

Blast结果的详细解析》上有4条评论

  1. 老大,能不能说说一下在线BLAST结果的详细解读。
    感谢了,
    我发现网上实际结果和你说的不大一样啊
    发到我邮箱ketixiezuo@126.cm

  2. 哦,我这里说的结果是本地化Blast默认的输出结果。NCBI的BLAST页面也都是在做不定期的更新,越来越人性化,功能也更趋向于多元化、复杂化。不过都还是建立在原有结果的基础上的,有些是为方便查看、有些是根据不同的需求对结果做了二次处理。我也将再写一篇关于如何解读NCBI BLAST结果的文章,敬请关注。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

请启用Javascript,以完成验证!