论文部分内容阅读
提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和n折叠交叉验证方法测试了新方法的性能。预测结果表明新方法具有良好的预测能力,与使用同一数据集的已有结果相比较,新方法的Jackknife结果和目前最好的方法取得的结果相当,可作为蛋白质结构类预测的一个工具。