蛋白质序列特征提取及其在功能预测中的应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hyflover
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征提取和分类算法是蛋白质功能预测的核心步骤。蛋白质功能的确定有助于阐明生命体在生理或病理条件下的变化机制,并且对于疾病预防和药物开发等方面都有着十分重要的推动作用。随着生物信息学的不断发展以及相关数据的大量积累,使用科学计算方法对未知蛋白质进行功能预测成为后基因组时代生物信息学中的重要研究课题,所以蛋白质序列的特征提取和分类算法也成为当前生命科学研究的首要任务之一。本课题主要对蛋白质功能预测中的序列特征提取方法、分类算法进行研究,并设计适当的特征提取方法和分类算法在蛋白质序列数据上进行功能预测的实验。本文的主题工作包括:1.提出了一种基于BLAST比对的特征提取方法。本方法打破了现有的基于BLAST序列比对的特征提取模式,利用B12Seq的相似性分析结果,得到评价片段相似性的E-Value数列和Score数列。根据两者所代表的意义以及组成特点,提出一种新颖的蛋白质序列特征提取的方法。为了证明算法的有效性,将此方法与现有的此类特征提取方法分别应用于蛋白质功能预测的实验,实验结果证明新方法更全面、准确的体现了序列特征,有助于取得更高的预测准确率。2.提出了一种基于距离权重的分类算法。该分类方法的思想是:在传统K近邻算法的基础上加以改进,为每个近邻赋予一定的决策权重,将近邻序列与未知序列的相似距离作为权重的参数。分类时,近邻序列的数量与近邻序列的权重都起到了一定的决策作用。将该分类算法与基于分组重量编码的特征提取算法相结合,进行蛋白质序列的功能,预测。实验结果表明:这种方法具有数学模型简单,计算复杂度低,分类准确率较高等优点。
其他文献
通过深入比较GIS平台与CAD平台的优缺点,研究开发了基于COMGIS组件MapObjects的城市排水管网规划GIS辅助系统,在GIS平台上同时实现了管网绘制、管网计算、管网调整三大功能,
目的建立大鼠白念珠菌支气管肺感染模型,观察感染后肺Toll样受体2(TLR2)和IL-10水平的变化,探讨TLR2和IL-10在念珠菌支气管肺感染中的作用及意义。方法建立白念珠菌支气管肺感
乡镇卫生院在农村三级医疗卫生保健网中,是联系村卫生室和县级医疗卫生单位的中枢,集农村医疗、预防保健、健康教育等责任于一身,在满足农村居民的医疗需求、防病治病等方面起着
本文通过多年的经验总结,力求详尽地阐述高纬高寒区在节水灌溉技术的应用和技术方案选择中,当前可能的原则及发展方向。
近年来,大学生社区志愿服务在社区建设中起到越来越重要的作用,积极探索大学生社区志愿服务的工作模式,构建大学生社区志愿服务的项目化管理以及长效、调研、激励机制,能有效
随着市场变化的不断加快,企业对软件产品的发布速度也提出了进一步的要求。而使用Scrum敏捷方法,则能够使软件产品更为快捷的发布。基于这种认识,本文对基于Scrum敏捷方法的
2018年,中国汽车工程研究院股份有限公司和中国消费者报社联合开展了以消费者购车用车为核心的“中国消费者汽车驾乘指数”研究工作。2018年9月3日,中国消费者汽车驾乘指数管
会议
为贯彻落实党的十八届三中全会精神和省委、省政府关于加快发展陇药产业的决策部署,加快我市中医药产业转型升级,现提出如下意见。$$ 一、充分认识中医药产业转型升级的重
报纸
<正>社会犹如一条船,每个人都要有掌舵的准备。同样,企业也应心系社会,按照资禀各尽所能。当前,以互联网为平台,不同行业企业之间开展"易物贸易",从而实现产品互通有无和闲置