论文部分内容阅读
为了解决表现形式多样性、信息利用和查找繁琐的困难,本课题利用XML构建了元数据库和词语表。元数据库以都柏林核心元数据集为基础,位于这些异构数据库的上层,记录了各个异构数据库对象的位置,负责整和并传递可以理解的描述信息。词语表被用来规范用户提交的词语,解决命名差异问题。为了协助进一步的研究工作,在此基础上,还开发了在线的统计/分析工具。
测试数据库的来源主要有北京市青少年生理常数数据库、北京协和医院人工耳蜗中心数据库、生物医学工程学系电子图书数据库、150天人胎海马基因表达信息数据库以及心电数据库。这五个数据库涵盖了生物医学研究各个不同的领域,包括分子水平的基础研究(150天人胎海马基因表达信息数据库),生理方面的基础研究(心电数据库),临床病历(北京协和医院人工耳蜗中心数据库),流行病学调研数据(北京市青少年生理常数数据库)以及电子教学资源(生物医学工程学系电子图书数据库)。
目前,该数据库群工作状况良好。实践证明,本文所提出的方法是为复杂数据资源建立的一种机器可理解的框架。