论文部分内容阅读
通过氨基酸序列来预测蛋白质功能与空间结构一直是生物信息学研究的重点之一。蛋白质二级结构是在一定的氨基酸残基的组成和排列顺序(即蛋白质一级结构)的基础上形成的,不同的氨基酸残基由于具有不同的理化特性,从而形成不同的蛋白质二级结构。文中以蛋白质数据库(PDB)为数据源建立了二级结构数据库,并选取疏水值、等电点等特征,利用蚁群聚类对二级结构进行聚类,其结果所表现出的特征符合既有规律,并为后期的预测工作提供了依据。