论文部分内容阅读
从蛋白质序列出发,我们首先将每条蛋白质序列分成等长的15段得到离散增量值、低频功率谱密度值、N端和C端的打分值和模体频数构成的组合向量表示蛋白质序列信息,用随机森林算法,对氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶中包含的亚类分别进行分类预测.总精度依次为90.86%、95.24%、96.42%、98.60%、97.53%和98.03%.除转移酶和水解酶略低于前人,其余好于前人的预测结果.