蛋白质的分类与注释资源

随着蛋白质数量的增加,对于这些蛋白质的分类与注释成为一个非常活跃的课题。这里将包含所有蛋白质序列的集合称为nr库,在nr库中,序列与序列的相似性是不均等的,当我们使用blast进行序列两两比对的时候,会发现有些序列有着较高的相似性,有些则完全不相同。我们将相似的序列分为一组,进行多重比对,然后再用不同的算法或者模型去剖析,对构建的多重比对序列进行注释,并以注释的结果为基础,对蛋白质进行分类。当有新的蛋白质出现的时候,再以这些算法为依据,对蛋白质进行注释或者分类。

下面是主要的数据库、工具以及基于的算法: 继续阅读

比较认可的生物信息学定义与分类

最近在读《结构生物信息学》,补充以及对于分子结构预测方面多些了解,其前言中,关于生物信息学的定义与分类,给我很深的印象,或者说形成了很强的共鸣,许多次交流,我都引用了其观点,但是意思好像没有完全说明白。这里就将其摘录下来。在给别人介绍起来,我是做什么的,就可以说,是做生物信息应用的,我的博客主题也是这个方面——应用。 继续阅读