生物医学本体匹配与集成技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:easyk8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
起源于哲学的本体作为一种能在语义和知识层次上描述概念的建模工具,可有效地解决知识工程中知识共享和重用两大问题。近几年来,随着生命科学的快速发展,生物医学领域也出现了大量的本体并且很多本体之间都存在着信息交叠的现象。但是这些本体大多是由不同组织、机构和研究者开发的。因此,在本体表示和本体构建上存在异构问题。为了能够充分利用已有的本体资源,有效地进行资源整合,构建面向特定需求的本体库,本文提出了基于任务的本体集成方法。本体集成的核心问题是概念和关系的相似度度量,其中概念相似度度量包括两个方面:(1)语义相似度度量(2)语用相似度度量。关系的相似度度量是通过对与关系相关的概念相似度度量来实现的。生物医学本体的概念通常是由词组甚至是包含数字的词组等更复杂的形式构成,因此给概念的相似性度量造成了很大的困难。为了更准确的度量生物医学概念的相似性,本文首先对本体概念进行预处理,将其分解成为多个token串并对每个token进行词性标注,然后使用基于WordNet和编辑距离的两种相似度算法对两个概念的token对进行相似度度量,最后将概念间的token对的相似度进行加权平均的到两个概念的相似度,取得了较好的语义层面的概念相似度。另一方面,利用本体的层次结构和概念的属性并借助领域本体UMLS进行概念语用相似度的度量,从而获得了较好的语用层面的概念相似度。为了利用现有本体构建面向特定需求的本体库,本文引入了核心本体的概念,并通过核心本体的集成完成了对本体间交叠部分的信息集成。核心本体的本质是原本体的子本体,包括本体中与中心概念密切相关的概念集和与该概念相关的关系集。在这个意义上讲,核心本体也就是任务在本体上的视图。通过实验验证,基于任务的本体集成方法提高了本体集成的效率和准确率。最后,针对以上研究,开发出基于任务的本体集成系统,并用详细介绍了系统各核心模块的功能及程序流程。
其他文献
舌诊是中医学中最有临床应用价值的中医诊断方法之一。近年来,随着计算机科学与技术的迅速发展,传统中医舌诊学朝着计算机化方向发展已经成为必然趋势。本文正是试图推广计算
随着社会信息化程度的提高,人们对于信息系统的开放性、灵活性和重用性都提出了更高的要求,企业应用系统的开发也受到了新的挑战。如何快速开发能够满足不同需求且高质量的应
近年来,随着全球经济的一体化和信息技术的迅猛发展,企业间的竞争已经转变为供应链与供应链之间的竞争。这种环境下,又出现了市场全球化、产品个性化等新特点,由于企业的生产经营活动主要由订单动态触发,供需企业之间往往又缺少中间库存的缓冲,这就需要对供需企业的采购与供应业务活动进行有效协调。本文即从供应链环境出发,针对企业间采购与供应模式的新变化,对企业间采购与供应协调方法进行了深入研究。首先,本文结合企业
可扩展标记语言(eXtensible Markup Language,XML)访问控制是保证XML安全性的一项重要技术。为了给存储在XML数据库中的XML文档提供有效的强制访问控制,从现有面向XML文档的
近几年来,Peer-to-Peer(简称P2P)作为一种新型的网络应用模式以其可扩展性,高度容错性等突出优点变得越来越流行。P2P技术的主要特点在于充分利用分布在终端电脑上的网络资源
当今计算机局域网络(LAN)的数据传输网络控制协议不外乎总线竞争、令牌及轮询等方式,这些方式不是实时性不强就是传输能力有限,不适合对实时要求很高的数据传输,如语音及图像等
随着计算机网络的广泛而深入的应用,保护网络系统的安全与稳定已经成为一个刻不容缓的课题。大规模网络安全态势分析是掌握宏观网络安全状态的重要手段,对大规模报警日志的分
在大规模科学数据共享以及大型企业应用中存在海量的数据库。由于系统的定制性和历史原因,造成了这些数据库共享存在以下难题:封闭性、数据孤岛、缺乏规范和标准。中医药科技
随着信息技术和管理理论的发展,工作流技术正成为当今技术研究的一个热点。但目前因为不同的研究者、厂商使用不同的工作流的描述方法,造成了不同工作流产品之间不能进行互操
本文针对当前嵌入式系统普遍存在的内存瓶颈问题提出了一种解决方案。这个方案主要基于ARM微处理器实现,它使用实时操作系统对存储卡进行管理,并通过USB设备接口进行数据传输,实