基于氨基酸组成分布的嗜热和嗜冷蛋白随机森林分类模型

来源 :生物工程学报 | 被引量 : 0次 | 上传用户:xukaiboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文献报道采用氨基酸组成分布提取特征值能有效提高预测分类精度,本文采用该方法提取特征值,使用一种新的组合分类器——随机森林,从蛋白质一级结构对嗜热和嗜冷蛋白进行分类。通过10倍交叉验证和独立样本测试两种方法检测。结果表明:当分段数量为1时,其精度最优,分别为92.9%和90.2%,暗示使用基于氨基酸组成分布提取特征值在该算法中并不能有效提高识别精度,这与报道结果不符,而该提取方法在SVM中却能适当提高识别精度;当引入6个新变量后,其精度分别提高到93.2%和92.2%,ROC曲线下面积分别为0.9771和0
其他文献
为描述西安市电动汽车行驶状况,选取三种方法构建工况:聚类法、V-A矩阵法、马尔科夫法。对试验获得的数据先进行降噪平滑处理,然后采用短行程法划分运动学片段,最后根据不同
做好数据分析处理工作,必需掌握几种分类算法。介绍了决策树算法、朴素贝叶斯算法和最近邻算法的基本思想和分类流程,给出了应用实例,比较分析了它们各自具有的优势和存在的
介绍在光伏电池伏安特性实验中应用Origin软件处理实验数据的方法。先利用Origin软件的双y轴绘图功能绘制光伏电池的伏安特性曲线和功率曲线,并进行多项式曲线拟合;再利用其
本研究以一台纯电动汽车为研究对象,利用GT-SUITE仿真软件搭建整车仿真模型,在驱动电机性能参数不变的前提下,研究整车动力性能对整车质量、风阻系数、滚动阻力系数、减速器