基于代价敏感学习的SUMO蛋白质修饰位点预测的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:mapgis_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的爆炸式发展,人类在很多领域都获得了不小的进步。人类基因组计划的实施以及下一代基因测序技术的成熟也产生了海量的生物数据。如何利用最新的技术挖掘数据背后的生物信息,对于生物学的长足发展具有重要意义。翻译后修饰是一类通过改变蛋白质原始化学组成成分的调节过程。它通过在一个或者多个氨基酸残基上添加修饰的基因组(例如磷酸酯,糖基,泛素和脂肪酰基)来调节蛋白质功能和细胞过程。小泛素修饰(SUMO)是翻译后修饰中非常独特和重要的一种,主要通过改变细胞内定位或其他类型的翻译后修饰来调节底物功能。SUMO蛋白是泛素类蛋白家族的重要成员之一,可影响蛋白质的稳定性,酶活性以及蛋白质相互作用。鉴定原核生物或真核生物中的SUMO蛋白修饰位点是十分重要的,可以帮助我们更好地了解各种疾病的发病机制,如癌症和阿尔茨海默氏病。数据不平衡现象在生物信息学中十分常见,正样本的数量远小于负样本的数量,在SUMO蛋白修饰位点预测的研究中中也存在这一现象。并且机器学习算法很容易受到数据不平衡的影响,尽管已开发出多种预测SUMO蛋白修饰位点的计算方法,但它们在不平衡数据集上的表现不佳,正样本的识别率都偏低。本文首先分析了前人提出的针对蛋白质序列的特征提取方法,提出了一种新的基于氨基酸在特殊位置的生化特性的新特征并进行比较,选出最佳的特征组合分别输入机器学习模型中进行实验。实验结果表明该新特征有助于提高模型的准确性。本文针对数据不平衡的问题,分别设计了涉及AdaCost算法和遗传算法对级联森林进行改进的SUMO蛋白修饰位点预测模型。实验结果证明这些措施能够大大缓解数据不平衡问题。与现有的方法相比,我们的方法不仅能够大大提升正样本的识别率,并且准确度(Acc),特异性(Sp),马修斯相关系数(MCC)和曲线下面积(AUC)等性能也没有降低。本文同时也对深度学习尤其是卷积神经网络在SUMO蛋白修饰位点预测的应用进行了探索,分别采用了不同的损失函数进行实验,分析了实验结果,探究了卷积神经网络性能不佳的原因,为今后的研究指明了方向。
其他文献
随着经济的发展和人们对生活质量要求的提高,越来越多的人对肢体矫正和器官替换有需求,生物医用金属材料最适合用来替代损坏的硬组织,主要的金属生物材料是医用不锈钢,钴基合
金黄色葡萄球菌(以下简称,金葡菌)奶牛乳房炎是奶牛乳腺组织受到金葡菌感染而引起的炎症反应。长期的抗生素治疗不仅加剧了致病菌的抗药性,同时增大了药物残留所带来的隐患。
人和动物通过多种外周感觉器官获得感觉信息,大脑能够整合这些信息,从而准确快速地对环境变化做出反应。我们前期的研究发现,小鼠的前额叶皮层(prefrontal cortex,PFC)富含听-视多感觉神经元,并且这些神经元具有多感觉整合的特性。然而,前额叶皮层锥体神经元(pyramidal neurons,PN)和PV中间神经元(parvalbumin-expressing interneurons,
肺炎性疾病一直以来严重危害养猪业,盐酸多西环素与氟苯尼考因对相关病原菌抗菌活性强、在猪体内药代动力学特征优良被广泛的用于该类疾病的治疗。由于该病常表现为多种病原
尾矿是选矿过程中产生的典型大宗工业固体废物,残留了大量重金属等有害物质,如何有效削减其中的重金属污染,并寻求最优的资源化利用途径,是人们关注的焦点。本课题以铁尾矿为
地质钻孔数据,简称钻孔数据,是国家地质行业重要资源,具有数据量大,种类丰富,价值高等特点。针对我国钻孔数据管理利用上存在管理模式分散,方法效率低、共享利用困难等问题,
在高温环境中服役的金属材料必须同时具有良好的力学性能和抗高温氧化性能。镍基高温合金由于其工作温度低于1100°C,其使用受到限制。因此有必要开发工作温度超过镍基高温合
一维压电纳米梁结构在微纳机械电子系统中应用广泛,而压电纳米梁结构是其中重要的元器件,对其电学和力学性能的研究至关重要。基于有限元方法,在有限元软件中实现了压电纳米
最终于2017年3月15日通过的《民法总则》,在对我国成年监护制度改革的基础上,增设了成年意定监护制度,兼顾了财产管理和人身照顾的双重机能,基本上实现了对我国成年监护制度的改革要求。我国的意定监护制度可以有效保障成年人的人身和财产利益,能够有效缓和老龄化社会中的矛盾。相比于委托和信托制度,意定监护制度在主体和事务范围、公权力的介入这些方面优势更大。但是对于我国意定监护制度的规定,仍有值得推敲、探讨
洪涝灾害是当今世界的主要灾害之一,严重危害了人民生命财产安全,对人类社会经济造成了重大损失。自我国1949年建国以来,洪涝灾害时有发生,造成直接的经济损失达百亿元规模。