基于叙词表的领域本体建模研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:yyk20071999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,叙词表是一种为解决信息的主题排序而创造的人工语言,它的本质是对自然语言中的词汇进行选择、规范、并揭示其间相关关系,由此形成受控词汇的集合,它的出现主要是为了解决大量的文献如何被方便科学检索的问题。然而,WWW是当今主要的网络信息的集散地,不仅汇聚了海量的信息,而且信息数量正在以指数级的速度增长。随着数据量的激增,WWW上大量分布的无结构和半结构化数据日益加剧信息检索的困难,因此,如何组织海量的数字信息,并为用户提供精确高效的网络检索服务成为重要而迫切的研究课题,这引起了人们对传统知识组织工具如叙词表、分类表等在网络环境中适应性的争论。尽管叙词表和分类法等传统知识工具已开始在网上发展,但是对机器语言来说,其互操作性和表达性仍比较差,为此人们提出了本体这种能在语义和知识层次上描述信息系统的概念模型建模工具。领域本体构建的重要意义主要体现在: 首先,领域本体的目标是捕获相关领域的知识,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇之间相互关系的明确定义。从而实现人们对同一客观事物的共识,形成一个统一的认识事物的标准。即为人类认识活动构建顶层概念框架。 其次,本体更加突出知识共享的功能,尽管二者都对概念间等级关系、相关关系进行了揭示,但本体更着眼于给出人类事物认识的知识(或领域知识)总框架,因为在本体的一个实体中每个概念都有其属性信息、实例信息,而这些在词表系列中则少有展示,很多已经涉及到专业词典中的知识,因此说一个本体是一个人类知识(或领域知识)体系的汇总毫不夸张。 最后,本体的出现还是为了设计一种机器可以理解的语言。通过本体可以克服计算机系统之间的语义鸿沟,实现某个领域内不同主体(人、机器、软件系统等)之间的对话、互操作、知识共享等目的,于是它被认为是一种共享的概念模型的形式化的规范说明。其中形式化就是指应该是机器可读(可理解、可操作)的意思,而这也成为了在计算机网络环境下应用研究的主题之一。 领域本体的构建体现了目前的趋势,但是原本属于本邻域的叙词表是丢弃还是融合?这是本文探讨的问题。笔者认为,由于叙词表和领域本体之间有许多的相同和不同之处,使得基于叙词表来构建领域本体具有一定的优越性。由于某学科领域的叙词表包括本学科领域中相对比较完整的术语(叙词),因此这些术语(叙词)可以为本领域本体中的概念的创建提供指导;另外,叙词表中的限义词、
其他文献
随着美国《汇率改革促进公平贸易法案》的出台,人民币汇率成为国际社会的关注焦点。人民币汇率制度被指控通过人为操纵而低于实际水平,从而获得不公平的竞争优势,这形成对出
公共文化服务是社会主义先进文化的重要组成部分,也是构建社会主义核心价值体系的重要基石。现阶段的公共文化服务供给存在着供给不足及非均等化等问题。为保障公民基本文化
通过对指数曲线法的论述及其在工程实例中的应用,得出此方法的预测结果与实际沉降数值的误差在工程的允许范围内,因此证明了指数曲线法在地基沉降预测中的可行性。
目的探讨血清甲胎蛋白(AFP)、AFP异质体(AFP-L3)及异常凝血酶原Ⅱ(PIVKAⅡ)单独和联合检测对原发性肝癌(PHC)的诊断价值。方法收集该院62例PHC患者、99例良性肝病患者(对照组
[目的]建立软肝化纤丸的制备工艺、质量控制方法。[方法]根据药物组成设计制备工艺,采用高效液相色谱法进行定量鉴别。[结果]以方中所有药味粉碎成细粉加蜜制丸剂,以芍药苷含
LTE是下一代移动通信系统重要的无线技术,具有频谱利用率高、高带宽、大容量等优点,未来随着LTE网络的大规模开展,网络运营将面临LTE和GERAN/UTRAN等多种网络长期共存的情况
在Internet日益普及的今天,语言文字作为信息的载体越来越多的出现在人们的视野中,因此自然语言理解成为了一个热门的研究领域。中文自动分词作为自然语言理解的第一步,分词
止裂钢是在碳素钢的基础上发展而来的一类高强低合金(High Strength Low alloy)钢。从工程角度考虑,绝大多数工程结构要经过焊接,在焊接区不可避免会存在许多缺陷,很容易引起
电针为主治疗腰椎间盘突出症的临床研究主要有电针配合推拿、电针配合灸法、电针配合刺血、电针配合中药、电针配合功能锻炼和电针配合穴位注射,其中电针配合推拿治疗报道的
因我国高速铁路工程建设项目招投标监督有其现实必要性,通过分析我国高速铁路工程建设项目招投标的路径,剖析了我国高速铁路工程建设项目招投标监管法治化面临着相关法律体系