蛋白质功能相关问题的预测方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:hexiaole632
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的顺利完成,新的高效的实验技术的广泛应用,产生了海量的基因序列信息,生命科学方面的研究也正式步入了后基因组时代。蛋白质参与到生命活动的方方面面,蛋白质研究方面主要着重基于蛋白质的序列来分析蛋白质的结构和功能。蛋白质的结构与其功能是相关的,一种蛋白质能够表现出特定的功能,是由其独特的结构所决定的。生命的基本过程就是不同功能蛋白质在特定条件下系统作用的结果,蛋白质相互作用在生物体中几乎无所不在。蛋白质结构类和蛋白质一蛋白质相互作用的研究不但有助于对其功能的认识和理解,揭示生命活动的本质,帮助了解相关生物功能和了解相关的生物过程机制,而且有助于对相关疾病的分析和开发治疗的药品。研究蛋白质功能方面的相关问题具有必要性和紧迫性,蛋白质结构类和相互作用预测方法研究更是其中的热点和难点。传统的生物实验方法已经无法满足对大规模测试的需求,研究人员从计算的角度在一定程度上解决了传统方法的缺点,大大加快了测定的速度,但是还是存在一些问题。本文提出了两种新颖的预测方法,分别是基于序列信息编码和基于多示例学习算法进行相关问题预测。在结构类预测方法研究中,本文的重点在于通过新的特征编码构造尽可能的反映蛋白质最真实的结构,而不仅仅是序列的组成信息。在蛋白质相互作用预测研究中,通过多示例学习中的示例标签的不确定性巧妙的基于结构域信息直接进行相互作用的预测。本文的研究工作主要为:1.对现有的针对蛋白质结构类和蛋白质相互作用预测的计算方法进行了分类总结,对不同方法的理论依据以及优缺点进行了简单阐述。2.从蛋白质序列特征构造的角度提出了基于自相关系数和伪氨基酸组成的蛋白质结构类预测方法。以往的基于序列的特征向量构造时大多只考虑了二十种氨基酸在该蛋白质的序列中所占的比重,更多的考虑组成信息,较少考虑其中的排列顺序和耦合信息。通过自相关系数和伪氨基酸组成两种序列编码方法,能够在反映出序列中氨基酸的位置信息的同时,考虑到序列内部相距不同长度位置的氨基酸间的相互影响,能够较为真实反映蛋白质的真实的结构信息。通过在公认的数据集及独立构造的数据集上进行多次实验,相比传统氨基酸组成方法提高了14.49%、8.33%和2.78%,对比分析表明新的方法能提高预测的准确性。3.论文提出基于结构域信息和多示例学习的蛋白质相互作用预测方法。传统的基于结构域方法通常需要从已知相互作用的蛋白质对中明确哪些对结构域是相互作用的,然后才能去进行未知的蛋白质相互作用预测,然而现实中往往很难获得详细的这些信息。针对此类问题,本文利用多示例学习的思想,根据包有标记、包中示例没有标记这一特点,将蛋白质对看成一个包,将蛋白质对中的每对结构域看成示例,这样就不需要预先知道哪些结构域间是相互作用的。该方法模糊了某个示例是否是导致蛋白质相互作用的信息,简化传统结构域方法的步骤。在自主构造的数据集上,分别应用多示例学习算法和常用的机器学习算法进行多组实验,对比发现该方法是有效的。
其他文献
现代科技发展日新月异,人工智能、区块链、云计算、大数据等高精尖信息技术大量涌入现代人的生活,不断改变人们原来认知世界。人类社会由信息时代逐步进入真正的人工智能时代
本研究根据2014年2月~7月逐月的六次调查,监测了升金湖上湖区浮游植物的种类组成、优势种、密度、生物量、生物多样性指数以及主要的环境因子,以期了解升金湖浮游植物群落结构
目的:观察麻麦蚣部莱菔方治疗小儿哮喘痰热阻肺证的临床疗效及安全性。方法:将60例符合纳入标准的患儿按照随机数字表法分为治疗组和对照组,治疗组予麻麦蚣部莱菔方免煎颗粒水冲服,对照组予吸入用布地奈德混悬液与复方异丙托溴铵溶液高压泵雾化吸入治疗,5天后进行数据统计分析。结果:治疗组在总分、次症积分方面优于对照组(P<0.05),在总有效率方面明显优于对照组(P<0.01)。两组均未发生不良反
热应激对高产荷斯坦泌乳牛造成诸多不利影响:生理上,表现出体温、呼吸频率、出汗率上升以及内分泌系统变化;生产繁殖上,采食量、产奶量、繁殖力均有所下降;健康上,乳房炎、酮
随着中国第四波婴儿潮以及消费升级,中国的母婴市场进入了蓬勃发展的时期。婴幼儿配方奶粉品类作为母婴市场的标的性品类经历了几年的快速增长,但是随着新生儿出生数的减少以
ASR蛋白是第7组LEA蛋白,是生物体中一类与渗透调节相关的蛋白家族。当植物受到干旱、低温、高盐和ABA等逆境胁迫时,ASR蛋白会大量表达,以减轻逆境对植物造成的伤害。研究ASR
社区是社会居民生活的聚集地,社区居民参与体育锻炼不仅可以提高身体素质,增进健康,而且还可以发展社区体育文化水平,营造社区体育氛围,为社区树立健康社区的榜样。社区居民的体育锻炼方式是体育发展的方向与趋势,也是未来体育发展的指南针,社区居民的体育锻炼也为我国实现从体育大国到体育强国打下坚实的基础。本文研究如何增强武汉市社区居民体育锻炼方式的有效性,为武汉市社区体育的发展起到重要的作用,也为全民健康的发
气液两相搅拌反应器由于操作简便,适用性强,广泛应用于化工、冶金、生物、发酵、食品等行业。氧传质系数是气液搅拌反应器设计的关键参数,研究新型搅拌桨的氧传质性能对促进气液两相搅拌反应器的工业化应用有着重要的意义。本文提出了一种半弧面新型斜叶桨(HCP),在中试规模搅拌槽中进行了实验研究,结合CFD模拟研究了其流体力学和氧传质性能,并优化了半弧面新型斜叶桨的结构。首先,实验研究了气体分布器、搅拌转速、气
火炮身管作为管道的典型,在使用过程中,内壁要承受气体的烧伤腐蚀与弹丸的冲击和磨损,产生疵病,降低了火炮的精度和使用安全性。故火炮内膛检测尤其是深度信息检测尤为重要。常用的管道检测方法如投影法和CCD法等依赖于图像处理的精度,存在数据配准相机标定的问题,定量分析难,检测自动化程度低,轴向依赖于长推拉杆机械装置,不便检测火炮长管,存在自重造成偏心误差的问题。因此,研究出一种测量精度较高,能定量给出炮管
随着城镇化不断发展的需要,我国政府出台了一系列盘活农村宅基地相关的政策。2017年中央一号文件指出进一步盘活农村存量建设用地,允许通过村庄整理、宅基地退出等方式满足农