论文部分内容阅读
癌症等复杂疾病一直都是严重危害人类身体健康的重要因素。随着人类后基因组时代的开启和发展,大量高通量测序技术被不断研发出来,使得生物医学的研究逐渐摆脱了传统研究方法的制约。在此基础上,依赖于大数据的研究方法也被提出,加快了生物医学领域对癌症等各种复杂疾病的研究进程,其研究方式逐渐从单基因分析向寻找在细胞过程中失调的基因或生物通路转变。生物通路在人类生命活动中发挥了重要的作用,其微小的变化在一定程度上可能引起某种癌症的发生。生物通路分析已经成为目前癌症研究的重要方向,目前常用的癌症通路识别技术主要分为两大类:基于基因富集分析和基于网络的通路识别方法,这两类方法分别根据通路的基因功能和网络结构来寻找癌症和通路之间的关联关系。生物通路扩展也是一类重要的癌症通路分析方法,主要通过在人类基因网络中研究与通路密切相关的基因来寻找新兴的可能的致病基因,这对于探究癌症发生机制、寻找药物靶点和癌症早期预测具有非常重要的意义。在此基础上,本课题提出了一种基于网络扩展技术的癌症通路相关成分预测方法,首先构建了乳腺癌数据下的基因共表达网络作为算法的全局网络,并从全局和局部两个角度分析其拓扑性,然后将筛选出的与当前表型显著相关的通路基因集嵌入到全局网络中并从中抽取种子网络,最后在相关网络扩展算法的基础上提出了一种基于加权网络的生物通路扩展算法(WPEA),该算法融合网络多拓扑特性将种子网络在全局网络中进行扩展,实现了每个通路在当前表型下的扩展,并将其实验结果进行对比和分析。结果发现,相较于原始算法,我们的算法对所有原始通路都能有效识别出与当前表型和通路相关的基因,同时能识别出更多的与癌症通路相关的基因,预测效果更好。随着大量生物实验的进行,生物通路数据也在不断累积,这使得对其进行可视化的需求也在不断增加。本课题搭建了一款可编辑的生物通路可视化和分析系统,这一系统使用了网络表示和通路表示对生物通路进行可视化,满足了其在计算机学和生物医学对其可视化的不同要求,还以基因和通路为中心,实现了对基因、通路、疾病和药物几种不同生物实体信息之间的交叉查询,同时实现了可编辑、布局调整等多个功能。