基于支持向量机的蛋白质二级结构预测编码方法研究

来源 :安徽师范大学 | 被引量 : 1次 | 上传用户:anywho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构研究意义重大,分析蛋白质结构、功能及其关系是后基因组计划中的一个重要组成部分。然而用传统的实验测定方法复杂而费时,因此理论分析法预测蛋白质结构已越来越被看重。由于直接预测蛋白质结构难度比较大,相对简单的蛋白质二级结构预测就成了从蛋白质一级序列预测其空间结构的桥梁。蛋白质结构预测方法及其所用的编码方法都是影响预测准确率的重要因素,本文主要研究编码方法对蛋白质二级结构预测的影响,并提出了一种针对单序列蛋白质二级结构预测问题的综合编码方法。首先,本文介绍了二级结构预测的研究背景及意义,并介绍了一些相关的基础背景知识,比如生物信息学方面的知识、蛋白质的分子组成和结构分类、蛋白质结构预测特别是二级结构预测的常用方法以及其对预测结果的评价方法等。紧接着,本文介绍了支持向量机方法。因为蛋白质二级结构预测实际上是一个模式识别问题,支持向量机方法在解决小样本、非线性及高维模式识别中表现出许多特有的优势,因此本文使用该方法预测二级结构。而后文章研究了支持向量机在高维模式识别问题中的应用,以其在个人信用评估中的应用作为研究实例并取得了较好的预测结果。最后,对目前的几种氨基酸编码方式进行了比较研究并分析其各自的特点和缺陷。针对单序列非同源或低同源蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸。而后将新的编码方法和其他编码方法在相同的实验条件下进行训练建模预测,实验结果表明新的编码方法更加充分利用了蛋白质一级结构信息,比较适合非同源或低同源蛋白质结构预测。
其他文献
随着现代企业制度的不断完善,企业文化和人力资源管理两者密不可分。企业文化提供企业价值标准、道德规范和行为准则,不仅成为企业人力资源管理运作中的精神和行为依据,同时
耐甲氧西林金黄色葡萄球菌(MRSA)的医院感染近年来有逐渐增多的趋势,尤其是耐甲氧西林凝固酶阴性的金黄色葡萄球菌(MRSCON)医院感染增多更为明显,甚至造成耐药菌株的医院流行川。20
【正】 一、什么是基本建设什么是基本建设?顾名思义,即为生产奠定物质基础的建设工作。物质的生产,是人类社会存在和发展的基础。生产,就是劳动者使用工具,开动机器而作用於
目的:明确组蛋白去乙酰化酶2(HDAC2)在肝细胞肝癌(HCC)中对基质金属蛋白酶9(MMP9)表达的影响。方法:利用mRNA表达谱芯片数据进行统计分析,确定HDAC2和MMP9的mRNA在HCC组织中
文章详细地介绍一种多波段搜索雷达模拟器的收发设计。系统采用基带I/Q数字信号及数字上变频技术、宽带直接频率合成、直接中频采样等技术实现了多种雷达模拟信号及杂波信号
磷酸化修饰是生物体内最重要的蛋白质翻译后修饰之一,蛋白质的可逆磷酸化过程是真核细胞生命活动最普遍的调控手段,确定磷酸化蛋白质的修饰位点是磷酸化蛋白质组学研究的首要任
对鹤岗某石墨尾矿进行了各项物化性能分析和陶瓷材料制备试验,研究其用于陶瓷原料的可行性。结果表明,该石墨尾矿是一种较好的生产陶瓷的原料,原料易得、价格低廉、使用方便;
[目的]分析沂河流域近50a的降雨量和降雨侵蚀力的时空变化特征,为流域水土流失防治及土地利用合理规划等工作提供参考。[方法]利用沂河流域及周边12个气象站1961—2010年的日
党的十八大报告中,对于农民工子女教育问题,将原来的“平等接受义务教育”改为“平等接受教育”,“义务”两个字的删改意味深长。这也就意味着在高中阶段求学和异地高考将有可能
报纸
近年来,城市的规模不停地扩大,人口不断增加,城市化率不断增加,工业不断地在发展,区域的污水量也在不停增加。随着城镇化和工业化的更进一步地发展,水资源的供求矛盾越来越突