集成神经网络在预测蛋白质相互作用位点中的应用

来源 :济南大学 | 被引量 : 2次 | 上传用户:qxff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质之间的相互作用是各种生命活动的基础。而蛋白质相互作用位点在现代药物设计与构建蛋白质相互作用网络方面是至关重要的。因此,认识与研究蛋白质相互作用位点在理论和实践上都具有重要的意义。由于通过生物实验来确定蛋白质之间的相互作用位点费时又费力,而且实验过程中往往还会碰到一些难以预料的情况,因此,采用一些理论方法来分析与预测蛋白质之间的相互作用位点具有十分重要的价值。近些年来,随着生物信息学与计算机计算智能学的快速发展,许多应用计算智能方法来预测蛋白质相互作用位点的研究也实现了较快的发展。本文就是在这种背景下应用计算智能中的神经网络集成方法来预测蛋白质相互作用位点。文中选用了两个数据集:一个含有35个蛋白质分子的数据集;一个包含149个蛋白质分子的控制数据集(S149)。然后提取了能表示蛋白质相互作用位点的一系列特征,如:序列谱、熵值、可及表面积、相关可及表面积、深度系数、突出系数、疏水性等。接着通过选取其中一些特征进行组合来创建有效的样本集。随之应用单个误差反向传播神经网络或径向基函数神经网络以及它们的集成来对这些样本集进行训练与测试。文中采用了三种集成方法:具有先验知识的投票表决融合算法、基于遗传算法的选择集成方法和一种基于主成分分析构建集成分类器的新方法。实验中采用35次留一法(一倍交叉验证)和十倍交叉验证分别对两个数据集进行了预测。对于第一个数据集,通过对序列谱、熵值和可及表面积三种特征的组合,创建了4个样本集。然后运用误差反向传播神经网络以及其集成对这个数据集中的蛋白质相互作用位点进行了预测。集成方法采用的是具有先验知识的投票表决融合算法。对于第二个数据集,我们进行了两种不同的实验。第一种是提取了10种特征并且根据这些特征创建了4个分别含有9滑动窗口的样本集。这4个样本集由径向基函数神经网络计算,并且网络分别由粒子群优化算法优化。这样得到4组结果。最后4组结果由基于遗传算法的选择集成方法来集成。第二种是提取了24种不同特征,根据这些特征我们只创建了一个样本集。这个样本集也是通过径向基函数神经网络来计算,网络计算过程中也是由粒子群优化算法来优化。最后,我们采用一种基于主成分分析构建集成分类器的新方法来处理这个训练数据集,并且与传统的Bagging和Adaboost方法进行了比较。实验结果表明:三种集成方法都使预测精度有了不同程度的提高,并且比传统的Bagging和Adaboost方法也有一些提高,这说明集成预测分类器的预测能力更好、更有效。
其他文献
随着我国经济的迅速发展,对能源的需求量越来越大,管道运输业正飞速发展,它在国民经济和社会发展中起着十分重要的作用。由于管道传输距离长,沿途多为荒漠、沼泽等区域,人工
随着云计算、大数据、物联网和普适计算的发展,网络资源数量的指数增长,人们按照需求得到想要的服务成为可能。但是如何在海量的Web服务中找到符合自己需求的服务依然很困难
目前,人类通过各种先进技术和仪器对海洋进行了深入的研究,获得了大量的数据文件。但是目前海洋数据文件格式众多,而且存储地域分散,这给用户使用带来困难。如何合理、高效地
水稻是我国重要的粮食作物之一,研究其生长特性可以通过合适的方法提高作物产量,但由于对水稻的实地研究有很大局限性,所以构建虚拟水稻生长模型对水稻生长特性的研究具有重要意
模型驱动架构MDA是以模型为中心的软件开发方法,能够显著提高软件开发效率,被面向对象专家预言为未来最重要的方法学。目前已有成功实施MDA的案例,特别是在嵌入式系统开发中
信息隐藏集多门学科理论和技术于一身,主要应用于隐蔽通信和数字水印。信息隐藏最大的特点是:利用人的感觉器官对数字信号的感觉冗余,以数字媒体或数字文件作为公开的载体信
图像拼接技术是计算机视觉和图像处理领域的研究热点。图像拼接技术是将具有重叠部分的两幅或多幅图像融合成一幅具有更大视角、更高分辨率且包含每一幅图像信息的新的图像的
塔式起重机作业环境中特殊效果种类繁多、表现各异,主要特点是形状不固定、运动不规则,难以用常规的建模和绘制方法来仿真,或者所建立的模型往往难以兼顾真实性、实时性和开放性等要求。粒子系统是用于不规则模糊物体建模及图像生成的一种方法,此方法采用了一套完全不同于以往造型、绘制系统的方法来构造和绘制景物,形成了景物的整体形态和特征以及动态变化。本论文以起重机驾驶模拟器作为场景,设计与实现了基于虚拟现实的逼真
运动物体检测技术是在图像序列中将运动物体从背景图像中提取出来的技术,是目标分类、跟踪和行为理解处理的基础,广泛应用在工业、医学、军事、教育、体育等领域中,为高级运
作为网络安全防护系统的入侵检测系统[1],被用来检测危害威胁主机或计算机网络资源的可用性、机密性和完整性的企图或行为。因为其在计算机安全领域中的重要地位,近年来受到