基于多信息融合的蛋白质亚细胞定位预测方法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:dartal_1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质只有处于特定的细胞器如线粒体、细胞核、细胞质等,才能参与正常的生命活动。蛋白质亚细胞定位信息可以为蛋白质功能的预测提供有用的线索,也能对蛋白质的相互作用、进化研究等提供必要的信息。生物实验方法既费时又费力,在实际应用中远远不能满足生物序列数据急剧增长的需要。为了加速蛋白质结构和功能的注解进程,越来越多的研究者利用智能计算方法进行蛋白质亚细胞定位预测。本文针对蛋白质信息的提取、融合及预测等信息处理问题,主要研究内容如下:1.综述了近几年蛋白质亚细胞定位预测的研究进展,主要是蛋白质序列的特征信息提取和预测分类算法。常见的特征表示有氨基酸组分信息,伪氨基酸组分信息和位置特异性得分矩阵等,以及后来研究者逐渐广泛使用的基于基因本体论和功能域等的方法。预测分类方法主要是支持向量机和K近邻等。2.提出了一种基于氨基酸的进化保守信息和位置特异性得分矩阵信息融合的蛋白质亚细胞定位预测方法。基于氨基酸序列提出蛋白质序列的进化信息和保守信息;对氨基酸序列的位置特异性得分矩阵进行分割,经不同分割比例实验结果发现黄金分割比例达到最优,进而提出黄金分割法并统计分割后片段的组分信息;将以上几种信息融合应用于凋亡蛋白数据集的亚细胞定位预测,ZD98数据集和CL317数据集的全局准确率分别达到98.98%和91.11%。3.提出了一种基于蛋白质序列的共有序列组分信息和基因本体论信息融合的蛋白质亚细胞定位预测方法研究。基于原始序列和共有序列信息提取,结合氨基酸的物化性质信息,通过搜索基因本体论数据库得到GO注释信息,主成分分析算法用于特征挑选,结合支持向量机方法进行预测。革兰氏阳性和阴性数据集分别可达到96.15%和95.95%的准确率。与现有的方法进行比较,结果显示了该方法的有效性。
其他文献
以木枣为试材,采用单因素试验和Box-Behnken试验设计,研究了酵母添加量、发酵温度、发酵助剂添加量对果酒发酵的影响;建立各影响因素的回归方程,并通过响应面分析法优化了发
目的探讨救护车内保持优良无菌环境的消杀技术。方法对江西省景德镇市第一人民医院16辆救护车消毒前后进行空气细菌培养,16辆救护车共分4组,每组均4辆,试验组为紫外线组、0.5
一天,读到新加坡女作家谭幼今女士的文章“让她好好做一个桃子”。主人公苏佳燕是一位在学业上找不到自信,在学校高度不合群的初三女孩。她说不想读书,书是苦的;她说喜欢烹饪
本文通过探讨城市道路隧道设计,首先从隧道的内轮廓及建筑限界、隧道横向间距、隧道中市政管线的敷设以及隧道选线和隧道线形要求等几个方面,分析了在城市道路隧道设计过程中
孢囊线虫的克星──“抗线1号”大豆新品种孢囊线虫的克星──“抗线1号”大豆新品种育成和推广,给东北三省出现的“大豆热”带来了福音。由黑龙江省农科院盐碱土利用改良研究所
伴随着我国社会经济的快速发展,互联网的普及与利用越来越充分,网络环境下高校的教育改革也发生了巨大的变化。宿舍是大学生生活和学习的重要场所,宿舍文化在很大程度上关系
SARS是21世纪出现的全新的严重传染性疾病,该病来势凶猛,具有较强的传染性,病死率较高。临床医生在对SARS病人进行抢救与常规治疗过程中,一般使用了较大剂量的糖皮质激素类药物,这
随着我们的生活日渐发展,我们对健康的重视程度也在不断提高。文中详细介绍系统是如何进行的疫情控制和预防,提高了城市的健康安全情况。疫情联防联控系统具有直观的操作界面
大学生思想政治教育是高校教育改革的重点工程。大学生党员作为高校学生群体的先进代表,在高校学生群里中具有引领作用,对高校思想教育工作的开展具有重要作用。文章以大学生
试验旨在探讨酸性与中性β-甘露聚糖酶组合效果及其不同添加量对断奶仔猪生长性能及血清生化指标的影响,为复合型β-甘露聚糖酶的开发提供依据。试验一体外仿生消化试验采用