生物异构网络的隐藏链接关系预测

来源 :厦门大学 厦门大学 | 被引量 : 0次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物系统是一种复杂系统,而生物网络是描述生物系统的一种有力工具。通过对生物网络研究,能够了解生物系统的运行过程,探索基因或其他分子化合物的功能作用。随着人类基因组计划的完成和高通量测序技术的发展,海量生物基因功能数据被搜集和整理,构造出不同类型的生物网络,如蛋白质交互网络等。生物异构网络则是根据研究目的和网络间关联性的不同,将多种不同类型的生物网络整合起来,构造出的更大类型生物网络。研究表明,相较于使用单个网络,使用结合多种类型网络的异构网络对研究的可信度和准确性具有更好的效果。  面对大量生物网络和异构网络,如何准确使用,从而揭示生命现象本质,成为功能基因组时代的关键所在。当前生物信息学领域,致病基因预测和致病microRNA(miRNA)预测成为两个热门的研究方向。本文希望通过异构网络研究,提出新的异构网络链接预测算法,并将算法运用于这两个热门领域。本文的工作重点和创新点如下:  1.提出基于HeteSim的多路径链接预测算法。引入HeterSim度量方法计算异构网络中相同或不同类型节点间相似程度。针对固定路径问题,引入常数值β,将基于固定路径的HeterSim方法扩展成多路径方法。多路径方法能够针对不同长度路径,进行不同程度的相似值抑制。使用多种评估方法进行验证,发现新方法在多个方面优于现有方法。  2.提出基于支持向量机的多路径链接预测算法。将预测问题看成是监督学习问题,已知链接当做正例,随机选出若干未知链接当做反例,同时引入支持向量机作为模型学习方法。使用学习出的分类模型进行链接预测,发现预测结果同最好机器学习算法的预测结果较为接近。对前10名预测进一步分析,发现预测结果相较最好方法更加合理。  3.提出基于矩阵分解的链接预测算法。将预测问题看成推荐问题,针对指定疾病进行基因(miRNA)推荐。算法将生物网络转换成矩阵形式,引入矩阵分解方法进行预测模型学习。研究发现,方法取得较好的预测效果。由于属于归纳类型方法,新方法能够对训练过程中未出现的基因(miRNA)进行预测。  4.提出预测平均重复率和平均度概念。通过对现有算法预测结果分析发现:很多算法倾向于将研究较多、链接度数大的基因(miRNA)推荐为致病基因(致病miRNA);针对不同疾病,很多算法的推荐结果有较大的重复率。预测平均重复率和平均度概念的提出,能够更加公正评判算法的有效性。
其他文献
由于森林火灾具有突发性和复杂性的特点,将计算机技术和数学建模技术应用于森林防火已成为必然的发展趋势。森林扑火方案是森林防火的重要组成部分,对于有效的组织扑救、减少
本文以协同工作平台服务系统CWPS研究开发为背景,结合Spring开发框架和中间件技术的思想,以面向对象/构件的方法为指导,建立共享接口网关软件构件模型,并运用设计模式等软件
信息产业的发展使信息安全越来越受到重视,而密码算法又是信息安全的基础与核心。自从高级加密标准AES(Advaced Encryption Standard)取代了数据加密标准DES(Data Encryption
HE-AAC(HighEfficiencyAdvancedAudioCoding)作为MPEG(运动图像专家组织)提出的下一代音频压缩标准,是目前最先进的音频压缩技术之一,被称为是21世纪的音频压缩标准。以智能电话、
NGN(NextGenerationNetwork,下一代网络)是基于分组技术的网络,能提供多种电信级业务,满足人们对各种新业务的需求。其中,在NGN上提供实时语音和多媒体业务是当前的热点。  与此
H.264/AVC视频压缩标准采用了几种变长码技术,例如指数哥伦布码和基于上下文自适应的变长编码。而在其参考软件中,这些变长码的解码算法对于理解标准的内容有很大的作用,但是在
语音处理技术有着广泛的应用领域,歌声旋律自动调整是语音处理技术的一个新的应用领域。对歌声旋律自动调整方法的研究在歌声评估、音乐教学、歌声纠正、娱乐等领域都有很大的
足球机器人的研究在近几年得到了迅速发展,使得这个多学科交叉的项目受到越来越多的关注,作为一个新的研究领域,有很多内容值得去研究。本文的研究对象是中型组足球机器人,着重对
指纹识别是生物特征识别技术中被广泛关注的应用之一。一个典型的指纹识别系统包括四个主要部分:指纹图像获取、图像预处理、特征提取和特征匹配。由于基于细节点的指纹识别无
随着数据库技术的不断发展及数据库管理系统的广泛应用,同多媒体数据一样,数据库也面临着版权保护的问题。当在Internet上允许指定用户远程查询和访问数据库时,数据提供者要