基于集成学习与柔性神经树的蛋白质翻译后修饰位点预测

来源 :济南大学 | 被引量 : 1次 | 上传用户:yanlj007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰在细胞生命过程中起到至关重要的作用,多种蛋白质翻译后修饰相互影响、相互协调,共同维持、促进各种细胞活动的正常进行。然而,翻译后修饰的鉴定在生物学上往往是繁复的实验工作,效率较低。因此,开发有效的生物信息学预测工具来提高修饰位点鉴定工作的效率势在必行。本文以蛋白质序列为基本研究对象,结合多种特征提取方法,通过计算的方法,对蛋白质翻译后磷酸化修饰和磷酸甘油酯化修饰的修饰位点进行了预测研究。针对磷酸化修饰,本文从其修饰的功能出发,从磷酸化修饰数据库中抽取了多条与信号传导功能相关的蛋白质序列,构建了数据集。在特征提取上,提出了一种新的提取方法,将氨基酸残基理化性质的分组信息融入到以氨基酸残基在滑窗中出现频率为基础的特征提取中。通过实验发现,在融合氨基酸残基理化性质分组信息后,同种修饰位点在相同的预测模型下,预测结果有了很大的提升。在本文中,利用基于粒子群算法优化的神经网络模型的预测准确率从58%左右提升到86%。本文在此基础上还围绕氨基酸残基序列的大小对实验结果的影响进行了初步实验,结果发现当蛋白质微序列包含23个氨基酸残基时,预测结果达到最优值。之后,本文将数据集按照十折交叉验证的方法进行整理,利用神经网络、支持向量机和柔性神经树三种模型集成学习的方法,按照新的特征提取方法对数据集进行实验。其中三种模型的组合策略按照少数服从多数原则进行投票。实验结果显示,三种预测模型进行集成学习后,预测准确率可以达到87.50%,较以前研究结果有了很大提升。针对磷酸甘油酯化修饰,本文利用柔性神经树模型对这种修饰展开预测修饰位点的研究工作,并将实验结果与本领域最新研究进展进行了比较。其中,数据集通过十折交叉验证的方式进行处理,并且蛋白质微序列的窗口值采用了以往研究人员的结论。实验结果显示,柔性神经树在等量的正负样本下,具有较大的优势,其预测准确率能达到90%以上,远高于先前研究人员发表的实验结果。柔性神经树预测结果中马修相关系数最高达到0.807,随着负样本比例的增大,虽然预测结果的准确率得到提高,但马修相关系数逐渐降低。当数据集包含全部样本时,预测结果的马修相关系数为0.326,降低幅度较大,可见正负样本数据不平衡对实验的结果影响较大。综上所述,本文在新的特征提取方法上,利用多种预测模型集成学习进行了蛋白质磷酸化修饰位点的预测工作,且集成后的模型表现良好。同时本文应用柔性神经树模型进行了磷酸甘油酯化修饰位点预测的研究,与最新的研究结果相比,该模型较大幅度的提升了预测性能。
其他文献
随着微电子技术、嵌入式技术和无线通信技术的迅猛发展和日益成熟,无线传感器网络已成为互联网应用领域中的研究热点。由于传感器节点自身的准确定位是无线传感器网络监测活
教育并不局限于学校教育,更重要的是儿童成长发育过程中身心健康成长的教育。通过大量相关文献的阅读和研究发现,儿童敏感期研究领域中存在着大量潜在的知识数据,有很高的研
等几何分析是一种基于CAD模型的几何的精确表示来进行模拟分析的新型技术,它的提出为实现CAD/CAE的无缝融合提供了新思路首先,本文对等几何分析的产生背景特点研究现状和热点问
无线Mesh网络(Wireless Mesh Network,WMN)是一种宽带无线网络结构,也可以看成是MANET和WLAN的结合体。在WMN中,随着网络拓扑逐渐复杂、节点数目逐渐增多,其网络性能可能会随之下降
随着高清摄像技术以及图像处理技术的快速发展,视线追踪系统的相关研究在最近几年取得了长足的进步。参考点光源等辅助手段的引入,有效提高了系统的精确度以及对使用者头部移动
随着社会经济的发展,水泥在世界范围内被广泛应用,已经成为基础建设中必不可少的建筑材料,并且需求量越来越大,同时水泥的高质量和高性能也越来越受关注。从微观上来看,水泥
曲面网格参数化与四面体网格参数化是处理三维体网格的一个关键问题。曲面三角网格参数化是实现纹理贴图的基础;体网格的参数化是信息重用、形状匹配与分析、网格的重构以及
流程工业在生产的过程中会积累大量的检测数据,对这些数据进行知识发现将对工业生产和控制过程产生有意义的指导。在分析了流程工业生产过程的几大特点之后,课题组提出了流程
随着科学技术的发展和社会的不断进步,人类社会已经慢慢呈现出高度信息化结构。由于信息的多样性以及海量的信息数据,人类自身处理信息的能力十分有限,所以信息化时代已经正
近年来,随着我国石油天然气管道运输事业的快速发展,而管道施工的工程量大,焊口多,易发生质量问题,每处问题都可能导致严重的后果。这就对焊接自动化过程的质量控制提出了很高的要