多标记学习的蛋白质亚细胞定位预测

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:fengk9000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是根据肽链空间折叠而得到的一种有机化合物,作为人类细胞和组织的重要组成部分,为维持人体正常的生命活动提供所需的营养物质。它只有定位在正确的亚细胞上才能发挥作用,因此,准确定位蛋白质所处的亚细胞位置是发挥蛋白质功能的重要前提。随着研究的深入,数据库中的多标记蛋白质序列不断被发掘,传统的预测方法容易受外界环境干扰且效率低,已无法满足多标记研究的需求。目前,很多研究者将机器学习方法引用到多标记蛋白质亚细胞预测中,该方法能够更好的构建模型准确预测蛋白质亚细胞位置。本文使用机器学习方法对多标记蛋白质亚细胞位置进行预测,研究内容如下:1.基于距离度量矩阵学习对多标记蛋白质亚细胞定位的预测方法,称为ML-loc COMMU。首先,利用伪氨基酸组成(Pse AAC)、组成分布编码(CTD)、基因本体(GO)、冗余探测转换(RPT)和进化距离转换(EDT)特征提取方法将有关蛋白质序列转化为可供计算机计算的数值并进行特征融合。其次,融合后的特征空间冗余信息占比增加,严重影响预测的准确性,我们采用最大化特征方差和特征标签依赖(MDDMf)剔除干扰信息获得最优特征子集。最后,将最优特征子集输入到基于多标记K近邻的距离度量矩阵学习(MLKNN-Commu)的分类算法中预测模型的有效性。通过留一法(LOOCV)测试,以革兰氏阴性菌数据集为训练集,新建植物数据集、新建病毒数据集和新建人类数据集为测试集,得到ML-loc COMMU在训练集上的总体实际准确率(OAA)和总体预测准确率(OLA)为97.41%和97.80%。在测试集上的OAA分别为93.94%、82.69%和80.00%,OLA分别为93.00%、86.01%和79.19%。研究表明,ML-loc COMMU模型对预测多标记蛋白质亚细胞位置能够发挥良好的效能,有效提高预测的准确性。2.提出一种基于ML-locMLFE的多标签学习方法。首先,使用伪氨基酸组成(Pse AAC)、分组权重编码(EBGW)、基因本体(GO)、分段局部描述符(MCD)、冗余探测转换(RPT)和进化距离转换(EDT)特征提取方法获取蛋白质的序列信息、物理化学性质、注释信息和进化信息并将6种单一特征进行融合。其次,利用多标记信息潜在语义索引(MLSI)降维方法减小特征空间维度,避免冗余信息的干扰。最后,采用基于多标签学习的特征诱导标签信息丰富化(MLFE)分类算法中评估模型的性能。通过留一法(LOOCV)检验,以革兰氏阳性菌数据集为训练集,革兰氏阴性菌、病毒、新冠病毒、新构建的植物数据集为测试集,得到5个数据集的总体实际准确率(OAA)分别为99.23%、93.82%、93.24%、72.73%、96.72%,总体预测准确率(OLA)分别为99.81%、96.50%、99.21%、69.23%和96.25%。研究表明,ML-loc MLFE方法在预测多标记蛋白质亚细胞位置中具有明显优势,为进一步研究多标记蛋白质亚细胞位置开拓新的思路。
其他文献
技师学院是指在中、高级技工院校的基础上,通过高端引领、内涵发展建设成立的最高层次的技工院校。技师学院对于加快改革和转变经济增长方式,推动产业转型升级提供强大的人才支持,具有不可替代、无法估量的作用。大部分的技师学院学生都是来自初中毕业生,其年龄阶段在15岁至20岁,正处于青春叛逆的关键时期,身心发展尚未成熟和协调。这是因为,技师学院的学生多来自于中招、高考失败而落榜的学生,其学习成绩相对比较差、生
<正>宫腔粘连(IUA)是由各种因素造成子宫内膜基底层受损、内膜纤维化,导致部分或全部宫腔封闭或宫颈管粘连的病理现象[1-2],临床可表现为月经过少、闭经、周期性腹痛、不孕及习惯性流产,严重危害患者身心健康,影响家庭和谐和社会稳定。目前关于IUA的病因、病理变化及分子机制逐渐阐明,妊娠、创伤及继发感染是其形成的三部曲[3],90%以上的IUA继发于各种宫腔操作术后[4-5]。近年来,随着人工流产、
小学是学生了解英语、掌握英语知识基本的学习方法、夯实学习基础、培养基础素养的重要阶段,如何创造性地使用教材,高效育人,成为教师要解决的问题之一。大单元整体教学指引英语教师重构单元内容,在“大观念”的驱动下统筹利用更多的课内外资源,使英语单元整体教学的覆盖范围更广,有效提高育人质量。本文通过探索小学英语大单元整体教学实践的策略,以期为提高小学英语教学质量提供参考。
对一例糖尿病酮症酸中毒合并急性重症胰腺炎的年轻女性,在给予及时有效的急救护理,糖尿病专科护理,胰腺炎专科护理后,该患者无并发症,转出重症监护室。
<正>对不同文化的跨界认识与理解可以丰富不同区域之间人的认知,亦可增加人们理解世界的多重视角。从20个世纪60年代以来,三代匈牙利电影人米克洛斯·杨索(1921-2014)、贝拉·塔尔(1955-)与拉斯洛·奈麦施(1977--)的代表作品,可以管窥到匈牙利艺术家对历史、文化与艺术的不同诉求以及他们不同侧面的深度认知。
期刊
阐述智慧化建筑中的电气工程特点,优化电气施工技术方案,加强电气施工质量的管控,确保电气工程的施工能够满足智能化建筑建设的要求。
文章在建立农村产业融合发展质量指标体系的基础上,运用熵值法对2014—2020年中国农村产业融合发展质量进行测算,构建地理加权回归模型(GWR)研究影响农村产业融合发展的主要因素。结果显示:2014—2020年,全国农村产业融合发展质量逐渐提升,在空间上表现出“东—中—西—东北”阶梯递减的特点。乡村消费占比、劳动效率、农业总产值增速等是驱动中国农村产业融合发展质量提升的主要因素,但对不同地区农村产
可触摸的触觉二维图像是视觉障碍人群获取图像信息的重要方式。目前大多数触觉二维图像都是直接由视觉二维图像转化为的可触摸线条图。在视觉二维图像中,通常运用透视和视角等视觉原理将三维空间关系转换为二维平面关系。视觉系统经过长期大量知觉学习,习得了这种二维到三维的映射关系。但是触觉识别二维图像时,触觉系统如何建立二维平面与三维空间的映射,目前尚有待进一步的研究。影响触觉识别二维图像中二维-三维空间信息转换
善意要求是公司法中最为尴尬的问题:它几乎一开始就被植入受信义务,但却一直被虚置不用,成为名副其实的摆设。在“商业判断规则”的庇护之下,公司管理者几乎无责任可言;在形式主义的遮掩之下,公司管理者可以轻易逃避责任。这样的法律规则与现代公司治理的要求格格不入,相距甚远。有鉴于此,有识之士认识到必须重新竖起受信义务中善意要求这面旗帜,并将善意要求落实为具体可执行的义务。受信义务在我国《公司法》中是一项远未
传统教学方式中教师在课堂中占据主体地位,忽视了对学生创造和自学能力的培育,这样的教学方式很难为学生后期学习提供帮助,因此,要解决这一问题,就需要改变传统教学方式,注重对学生社会责任意识的培育,为学生长远学习做好铺垫。从多角度对学校思想政治教育中社会责任感的内涵进行论述,并结合思想政治教育中学生的实际问题和缺陷,找到培养学生社会责任感的方式。