蛋白质相互作用数据管理与分析预测

来源 :南京航空航天大学 | 被引量 : 2次 | 上传用户:jayslacker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前生命科学研究已经进入后基因组学时代,其主要研究对象为结构基因组学和蛋白质组学。细胞的功能必须通过蛋白质相互作用才能实现,因此,对蛋白质相互作用的研究显得尤为重要。   随着高通量的生物实验技术发展和应用,产生了大量的蛋白质相互作用实验数据,但是此类方法所得到的数据假阳性和假阴性比率都比较高。因此,有效的计算方法被用来蛋白质相互作用预测的研究。本文旨在以机器学习及模式识别理论为基础,以蛋白质序列信息为前提预测蛋白质相互作用。   本文的主要工作包括:蛋白质相互作用预测算法和蛋白质相互作用数据管理工具。本文主要内容以及创新之处包括以下两方面:   1、本文蛋白质相互作用预测算法基于蛋白质序列信息。首先对样本数据进行预处理,预处理得到的数据格式为本文自定义的特殊批处理数据格式。然后,分别对蛋白质序列的氨基酸频率、位置、物化性质、生化相似性等特征分别进行特征提取。接着,采用支持向量机作为样本的分类器,因为支持向量机是基于结构风险最小化的统计学习理论,并且支持向量机支持小样本分类预测。对于每一个特征所得到的数据训练支持向量机预测模型,分别将其置于组分分类器中。本文的3个支持向量机预测模型作为组合分类器的子分类器,采用基于成员的组合分类器预测算法得到最终预测结果。本文对组合分类器算法进行了详细的研究和公式推导,并且计算得出基于成员数目的组合分类器理论约束条件。在3类数据集合上:人、酵母、果蝇验证本文算法,组合分类器预测准确率优于单个分类器预测准确率,并且部分数据集预测结果高于相关文献的结果。   2、本文的另外一部分工作是蛋白质相互作用数据管理工具的设计。因为本课题数据部分比较特殊:来源广泛、数据格式多样。因此会造成数据查询、插入和管理的困难。现有大部分网络数据库管理系统或提供蛋白质序列信息或提供相互作用信息,没有同时提供序列信息和相互作用信息。本课题设计的数据管理工具可以同时显示序列信息和相互作用信息,用户无需跨数据库平台就可以得到蛋白质相互作用研究所需的序列和相互作用信息。本工具为B/S结构,前台是基于ASP.NET网页开发平台和HTML脚本的WEB界面,后台采用C#.NET编写消息处理函数,前后台通信采用API函数。本工具的后台数据库采用SQL server。本工具是对蛋白质相互作用数据管理工具开发的一次有效尝试,其基本功能贴近课题实际。
其他文献
上期回答朋友们现在要不要买房,结果也有不少朋友来电或留言问:那现在到底要不要卖房呢?好吧,帮人帮到底,这次就来回答一下这个问题。首先,有一个最重要的问题得先搞清楚,那
该论文在水力过渡过程理论分析和数值模拟的基础上,对轴流泵建立数学模型进行计算分析,重点在于启动过程中电动机、水泵及流道中水流与压缩空气的瞬态特性和非正常停机时的水
德育教育是幼儿园学前教育中的重要环节,是引导幼儿树立早期的价值观念,养成良好的德行素养,培养良好生活习惯的重要教育形式.幼儿园德育教育工作的开展,需要深入结合幼儿心
随着新课改的不断深入,学习方式不断变化,让课堂教学绽放出新光芒的形式下老师需要不断努力,引领学生个性发展,让学生全面发展.初中美术内容从欣赏、造型与表现、设计与应用
论文根据珞璜电厂W型火焰锅炉存在的实际问题,在前人工作的基础上,对其在低负荷下的稳燃能力和调峰性能进行研究,为锅炉的优化运行提供理论依据和实际指导.论文首先对W型火焰
创客教育强调创新理念的教学方式对学生创新思维的培养能产生积极的影响.本文通过对洛阳市目前机器人创客教育活动现状及存在的问题进行归纳并提出了切实可行的对策和建议,从
随着科学与技术的进步,两相流的研究已经从宏观向微观,从一维向多维数值模拟方向发展.早期采用半经验理论公式计算传热和流动特性,被认为是目前最精确的模型.两流体模型中有
目前环境保护已经成为了所有国家共同关注的话题,因此每个国家都十分重视环境保护问题.但是环境保护不但要在社会上积极地进行宣传,更要将换环保教育渗透在幼儿教育中.让幼儿
在全面介绍汽轮发电机组振动状态监测及故障诊断的方法、技术和实施的基础上,提出了一种将数据库与数据文件有机结合,利用现代网络技术实现汽轮发电机组振动状态监测与故障诊断网络化的模式,按此模式开发了针对国产200MW汽轮发电机组的振动监测及诊断系统,并在某电厂投入了实际使用。 文中首先介绍了汽轮发电机组振动监测及诊断技术的发展现状,并对振动监测诊断技术的基本理论和方法,...
该文以石油化工管道振动评价为研究目的,研究内容主要针对往复压缩机管道.在现场管道振动测试的基础上,通过振动理论分析并利用有限元结构分析软件(ANSYS),对各种典型安装形