基于监督学习的激酶鉴定算法的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:aiyouxizhiwojian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由蛋白激酶催化所发生的磷酸化修饰作用在调节生物的生命活动中起着不可替代的作用,被称为细胞生命活动的开关。有些疾病的发生与由某特定激酶所催化的磷酸化修饰有密切的关系,因此识别磷酸化位点的激酶信息对于研究分子机理具有重要的研究意义,也有助于设计药物。  起初对磷酸化的研究主要依赖实验方法,主要包括32P标记法和高通量的质谱分析方法等。这些实验方法能够产生大量的磷酸化数据,然而大部分数据都缺少激酶信息,而且实验方法费时耗力。于是研究者们开始尝试通过计算学的方法找出磷酸化的规律并对磷酸化数据进行预测。基于计算的方法需要依托于磷酸化数据,通过实验方法产生的磷酸化数据为使用计算学方法提供了条件。如今,通过计算学的方法鉴定蛋白激酶已经成为解决激酶鉴定问题的主流方法。  本文在前人对磷酸化研究的基础上,综合考虑结构风险和数据间的空间分布这两种因素,提出了一种基于核矩阵的激酶鉴定算法SLapRLS,并将其应用于激酶鉴定工作。首先对从Phospho.ELM数据库中提取的人类的磷酸化数据进行处理,先通过遍历搜索找到并去除重复的数据,而后使用BLAST和CD-HIT软件进行去冗余操作,从而构建了可靠的训练数据。然后我们对核函数和基于核函数的机器学习算法进行了研究,并提出了利用专业知识构建核矩阵的方法。最后,引入了标记与相似度的不一致性来反映数据间的空间分布关系,结合标记与相似度的不一致性最小化与结构风险最小化提出了SLapRLS算法。通过10折交叉验证和独立验证法对SLapRLS进行了性能评估,结果表明SLapRLS能够有效的解决激酶鉴定问题。
其他文献
本文通过对荣华二采区10
期刊
文章基于CFPS微观数据实证研究了我国民族地区家庭的贫困成分、变化趋势和影响因素.结果表明:民族地区家庭的贫困发生率总体上呈下降之势,但是以家庭人口数为权重计量的慢性
随着临床上各种脑部及神经系统疾病的增多以及社会老龄化问题,使脑科学成为21世纪挑战性的研究。提高临床的早期诊断水平,及时予以控制和治疗是降低脑疾病对人类危害的最有效
正电子发射断层(Positron Emission Tomography, PET)是一种能够无创地以动态、定量的方式观测到活体生理和生化变化的医学成像工具。图像重建和数据采集与处理方法在PET研究
郑玄《周礼注》中二百多次提到《周礼》故书的版本特征问题.贾公彦以来,或以为故书、今书问题即古文、今文问题;或以为即旧本子、新本子问题.这些学者没有把问题讲透彻,有些
医学图像数据的不断膨胀使得对医学图像进行合理的压缩成为需要,而对压缩后图像的质量评估分类成为了必不可少的一步。 本文研究了一种基于小波分解的客观参数图像质量评价
本文通过对荣华二采区10
期刊
近年来随着移动医疗技术的兴起,穿戴式生理参数监测设备作为移动医疗技术重要的信息资源接入终端之一正逐渐成为研究热点。穿戴式生理参数检测技术的一个重要内容就是抗运动