论文部分内容阅读
RNA二级结构预测方法可视为一个分类问题,即根据单条序列或多条序列给出的信息,判断任意两个位点能否构成碱基对。现有各种预测方法对所用计算特征的选择都是基于定性分析,没有统一的标准。在总结现有RNA结构预测方法中采用的各类计算特征的基础上,利用特征选择技术中的过滤和封装方法,结合支持向量机分类算法,对它们的分类能力进行定量比较分析,找出适于RNA二级结构预测的最优分类特征子集,包括热力学信息、共变信息和进化信息。在49组Rfam家族上的测试结果显示,相比现存定性选择的特征子集,所选特征子集能得到更好的预测结