论文部分内容阅读
本文的主要研究内容主要包括以下几个方面:(1)在BioDW中引进了基因本体论作为数据整合的工具,以此建立科学的具有生物学意义的数据间的关联,形成了共同的基于基因本体论的生物信息数据描述标准,并以此为基础开发了基于信息内容的语义相似性查询工具;(2)通过数据格式转换工具—XBDETL程序,将多种异构的、自治的生物数据源的数据转换为能直接加载到数据仓库数据库中的文件;(3)将各个数据源之间的交叉链接关系整合在DBREF数据库关系表中,通过该表实现了不同数据库的交叉检索;(4)提供了多种数据查询的方法,采用符合生物学逻辑和规律的检索界面,使之便于生物学家进行数据查询和数据挖掘,成为能让生物学家可以直接运用的知识载体;(5)设计了一套数据自动更新的方法,定期将主要生物信息库中的数据提取到基于关系数据库系统的生物信息库数据仓库中,并生成相应的索引结构,从而从根本上解决了采用数据仓库技术所带来的维护困难等问题。
本文的主要创新点主要有:1)采用基因本体论的方法对各种异构生物数据进行数据整合。2)在1)所描述工作的基础上,实现基于基因本体论的语义相似性查询功能。提供了一种面向基因产物注释信息的查询途径。