中文常识本体的半自动构建与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户：seanswh

【摘要】

：

随着互联网技术的快速发展，网络上的信息数量呈指数级增长。人们迫切需要将这些信息集成为一个本体，在本体的基础上进行语义检索，以提高信息检索的查全率和查准率。然而，信息的表

【作者】

：

许斯渊

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2011年期

【关键词】

：

中文常识本体半自动构建本体扩展语义

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的快速发展，网络上的信息数量呈指数级增长。人们迫切需要将这些信息集成为一个本体，在本体的基础上进行语义检索，以提高信息检索的查全率和查准率。然而，信息的表现形式各异，包含的内容涉及到人类生活的各个领域，且不同领域的数据在结构和语义上都存在一定程度的差异，这些特征在多媒体信息中表现得尤为突出。一个具有统一标准结构的常识本体不仅能够在描述信息的底层特征的同时，表达其内容的高层语义，而且可以解决数据集成的异构问题，同时对本体间的集成和映射具有重要的作用。面对海量的常识性知识，本文将基于字典和基于自由文本的两种本体半自动构建技术相结合，提出了一种中文常识本体半自动构建方法。该方法首先将字典给出的分类知识自动地转换为常识本体的核心，然后半自动地将字典中的其它信息添加到核心本体中，接着运用基于自由文本的动态扩展机制，从互联网上的在线新华字典中抓取本体中概念的解释，通过分词技术和句法分析技术抽取其对象属性。实验结果表明，该方法能够在解决自动化构建和动态扩展两个问题的基础上，半自动地创建一个中文常识本体，并从结构化、描述粒度和成熟度这三个指标对中文常识本体进行评估分析。为了体现中文常识本体的应用价值，本文设计了一个中文常识本体应用系统。该系统实现了中文常识本体的查询功能、领域本体的“基本体”提取功能以及多媒体信息语义检索功能。“基本体”的提取使得各领域本体都建立在中文常识本体之上，较好地解决了本体之间的集成与映射问题。多媒体信息语义检索系统能够在计算机理解语义信息的基础上，快速准确地检索到用户所需要的多媒体信息。同时，本文在该应用系统的基础上，提出了一个医疗保健产品语义发布系统的设计构思。论文最后对中文常识本体半自动构建与应用的研究工作进行了总结，并阐释了工作中存在的问题以及对未来工作的展望。

其他文献

基于非测距无线传感器网络节点定位算法研究

随着传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术的迅速发展和日益成熟，推动了具有划时代意义的无线传感器网络的产生和发展，其目的是协作地实时监测、感知、采

学位

无线传感器网络节点定位泰森多边形边缘节点蒙特卡洛算法

异构传感器网络路由算法研究

近年来，随着微机电系统与无线通信技术获得长足发展，已涌现出许多种类的无线网络。这些网络的发展主要集中于提升数据传输率与降低网络能耗，而在某些能量受限的应用中，能量的有效

学位

无线传感器网络分簇路由协议负载均衡多跳路由

短文本分类中高品质特征模式抽取及扩展策略研究

随着互联网和通讯产业的快速发展，各种形式的信息扑面而来。而短文本(通常文本长度小于160字符)作为手机短信息、在线即时聊天记录、论坛用户评论等信息的主要表现形式，已经成

学位

文本信息数据挖掘信息分类程序设计

基于MAS的供应链突发事件应急协调机制研究

随着全球经济的迅速发展和市场竞争的日益激烈,企业正面临着更大的挑战和机遇,而供应链管理作为提升企业市场竞争力的重要手段,越来越受到企业管理者的重视。由于供应链所处的环境并非持续稳定的,经常会遇到各种各样的突发状况,如果不能及时处理,往往会给供应链系统带来巨大的损失。供应链应急协调作为供应链管理的重要内容之一,对于应对供应链中突发事件,改善供应链系统性能具有实际意义。本文将多Agent技术引入到供应

学位

供应链管理应急协调机制多Agent技术扰动数量折扣契约

中文短文本中的热点话题发现

短文本通常指文本长度小于160个字符，一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的热点话题识别问题是短文本应用领域必须解决的具有挑战性的基础问题

学位

短文本上下位关系话题识别网络聊天

动词次范畴化驱动的汉语句法分析

句法分析是自然语言处理领域的一个关键性问题,句法分析的任务就是根据给定的语法自动推导出句子的语法结构。句法分析性能的提高对机器翻译、信息检索、信息抽取、语音处理

学位

规则特征统计特征动词次范畴化汉语句法分析

绿色数据中心电能资源效率优化研究

随着大数据时代的来临，数据中心耗能达到万亿瓦。数据中心的高耗能给社会，环境以及经济带来了新的挑战。数据中心每年需要花费几百万美金用于日常电费的开销。此外还需巨额的花

学位

新能源利用率数据中心电能资源效率优化波动特性耗能特性

一种基于远程监督的中文实体关系抽取方法

学位

层次化政策和信誉导向的多Agent可信系统研究

虚拟组织是一种新型的业务组织管理模式,企业或个人之间通过网络建立丌放的、动态组合的虚拟组织来建立相应的合作联盟,并在虚拟组织内部进行协作、协商和资源共享。Agent具

学位

政策信誉多Agent可信系统虚拟组织

基于UML的面向方面行为建模研究

面向方面程序设计是一种基于关注点分离的技术，通过将核心模块级关注点和系统级横切关注点分离，为面向对象技术中存在的代码缠结和散射问题提供了有效的解决途径。随着面向方面

学位

软件工程学面向方面行为建模程序设计建模方法

中文常识本体的半自动构建与应用

其他学术论文