基于机器学习的蛋白激酶识别算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:aswangxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为真核生物细胞中最常见的蛋白质翻译后修饰形式之一,可逆的磷酸化过程被形象地描述为生命活动的分子开关,几乎调节着包括细胞生长、发育、分化、凋亡在内的所有生命活动。探索磷酸化修饰的生物机理及其对生命活动的影响具有重要的研究意义。   随着科学技术的发展,磷酸化研究取得了较快地进步。目前,实验已鉴定出大量的磷酸化位点,为我们对磷酸化机制的理解打下了基础。然而,现有的磷酸化数据库中激酶信息匮乏,这束缚了对磷酸化的进一步研究。本文针对这种研究现状,尝试利用生物信息学的方法为实验鉴定出的磷酸化位点识别其对应的激酶信息,从而缓解目前激酶信息严重不足的现状。以此问题为着眼点,主要在以下几个方面进行了富有成效地研究:   (1)从实验验证的磷酸化数据库Phospho.ELM中提取包含激酶信息的磷酸化数据。利用生物信息学工具,完成蛋白质和激酶名称的统一化,同时根据激酶的聚类规则,构建用于激酶识别的正、反例数据集,并对相关数据集进行在线发布,以方便相关研究的进行。   (2)从现有的生物数据库中收集并整理影响磷酸化过程的生物特征,包括基因本体特征和蛋白质-蛋白质相互作用特征,同时使用优化的编码方式对磷酸化位点周围的序列信息进行编码,进而构建磷酸化研究的特征集合。   (3)深度调研磷酸化研究领域已有的生物信息学工作,为后期激酶信息识别算法的提出打好基础。基于最大相关性最小冗余性的特征选择策略,筛选出激酶特异性的特征集合。并在此基础上,利用支持向量机发展专用于已知磷酸化位点激酶信息识别的生物信息学算法。使用留一法对激酶识别模型进行性能评估,发现该系统在假阳性率低于1%的高置信水平下,仍能保持较高的阳性数据检测水平。从与常用的激酶特异性的磷酸化位点预测算法和位点工具的比较结果可以看出发展激酶识别系统的意义和必要性。   (4)为方便国际同行使用激酶识别算法,开发了相关的识别网站和数据库,从而为相关的生物、医学研究工作提供指导和帮助。   本文的研究工作得到了国家自然科学基金(61101061,31100955),高等学校博士学科点专项科研基金(20113402120028)资助。
其他文献
目的本研究目的为确定同一近视患者分别使用软性角膜接触镜和框架眼镜矫正时,其相应的眼部参数是否存在差别,探讨这些差别是否与两种矫正方式的理论差异一致;为进一步探讨近视
安全阀作为各类承压设备重要的安全附件,良好的动态特性和准确的选型是其发挥保护作用的前提,而排量计算的精确性对安全阀的选型至关重要。现今国内外相关法规和标准均对安全阀单相流的排量计算进行了明确规定,但由于排量系数选取的不同导致计算结果存在较大差异,而法规和标准中规定的可压缩气体在亚临界排放下的排量公式不能准确计算带排放管道的安全阀排量值。另外,国内相关法规和标准均未提供气液两相流和闪蒸液体的排量计算
作为过程工业系统的重要子系统,换热网络也是重要的能量回收系统,其设计水平决定了过程工业的能耗和经济性。因此,换热网络综合逐渐成为研究的热点问题,而现有的综合方法都存
创新少数民族流动人口服务管理,是一项涉及民族团结、国家安全、社会和谐的系统工程,是新时期中华民族走向更大包容性、更强凝聚力的命运共同体的现实需要.
期刊
随着循环流化床锅炉的快速发展,高温灰渣的冷却问题越来越受到人们的重视。作为循环流化床锅炉的重要辅机,灰渣冷却装置的正常运行至关重要。为了满足高参数大容量CFB锅炉(特
本文以火电厂主蒸汽温度为控制对象,首先研究了单神经元自适应PID控制策略,然后引入了PSD算法,增加了增益的自调整,构成了单神经元无辨识自适应PSD控制算法。在神经元的权值
房前屋后,干净整洁;文化广场,健身娱乐活动异彩纷呈;农家小院,游客把酒言欢;田间地头,处处能见村民忙碌的身影……初春时节,湖北省恩施土家族苗族自治州鹤峰县的村村寨寨充满
期刊
随着人们在室内时间的增加和对室内环境要求的提高,使用暖通空调系统提供良好的室内空气品质和较高的热舒适性变得越来越重要。冷却顶板与置换通风相结合的复合式空调系统综合
近年来,在湖北省委、省政府的坚强领导和重视关心下,在省民宗委的统筹协调下,以省人社厅为牵头单位的8个“616”对口援建部门、11个定点扶贫部门以及省发改委、省财政厅、省
期刊
十堰市位于湖北省西北部、汉江中上游,是鄂豫陕渝毗邻地区中心城市.随着国家“一带一路”建设发展,以及城市化建设步伐的推进,各民族之间交往交流频繁,十堰逐渐成为少数民族
期刊