论文部分内容阅读
为了提高蛋白质二级结构预测精度,本文尝试采用一种基于串联BP网络集成的二级结构预测模型。首先根据二级结构是由其一级序列决定以及神经网络输出之间具有相关性,采用串联BP作为集成的子网络分类器,在训练过程中采用“剪枝法”和“早停”来防止过拟合。其次为增加网络的差异度,利用bagging方法对样本重采样并加入随机噪声。把单独训练的具有一定差异度的5个子网络利用相对多数“投票规则”进行整合。以Rs126中的90个蛋白质共15 377个氨基酸进行10倍率交叉验证,仿真结果表明此网络集成可以较好地对二级结构进行分类。