基于非结构中文数据源的本体学习

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:vbcasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,本体在信息检索和语义网等领域中发挥着越来越重要的作用。但是手工构造本体却是一项繁琐的工作。如何从大量中文文献中自动或半自动地获得本体,成为本体在中文环境下推广、应用的一个重要课题。本体学习是指利用人工智能、自然语言处理等众多学科技术来实现本体的半自动构建。本体学习任务主要包括本体所包含的各个元素的自动或半自动获取,例如概念获取以及概念间关系的获取等。本文在借鉴国内外现有本体学习理论、方法的基础上,结合中文自然语言的研究成果,针对特定领域的中文文本文档,对领域本体概念获取和概念间关系的获取展开了研究。在概念的获取方面,本文提出以一种多策略中文本体概念获取方法,综合统计、中文分词等技术半自动地提取领域概念,并以领域一致度、领域相关度等统计方法筛选提取的概念。在提取概念关系方面,本文重点研究以语境模式的方法提取概念间关系。本文对语境模式进行了较深入的研究,提出单句模式、多句模式和段模式三种不同的语境模式。另外,对语境模式的半自动生成作初步的研究,并提出了若干算法。最后,本文实现了一个中文本体学习系统用以试验本文提出的方法的可行性。
其他文献
本文提出了可重用的通用报表处理系统的概念,力图建立可重用的通用报表处理平台,从而在根本上解决报表处理系统的重复开发问题。这样的报表处理平台只需要开发一次,就可以方
对等网络(Peer to Peer Network,P2P Network)是当今学术界研究的热点之一,P2P应用也已成为当今因特网中流量最大的应用。在各种P2P应用中,资源共享是最主流的应用。如何构建
图像监控系统是一门集计算机技术、通信技术和多媒体技术于一体的综合系统。它以直观、方便、信息内容丰富等特性而被广泛地应用于工业生产、交通、电信、电力等场所。随着嵌
学位
随着语义网的发展,一些基于本体的应用也越来越受关注。而本体映射技术对于本体推理查询、本体集成等都是至关重要的一部分,本文将着重对此进行研究。首先,论文简单介绍了课
图像分割是图像处理与计算机视觉中的关键步骤,也是研究的重点与难点。无论要在图像中识别目标,或者提取其他的信息,首先要做的一步就是图像分割。图像分割可以理解为将图像
针对H.264基于率失真优化算法的模式选择的高复杂度,本文从帧内帧间两方面着手改进算法:在帧内模式选择时,本文采用基于纹理和时空域的多精度快速算法:引入两个指标来指导4×
工作流技术是实现企业业务过程建模、业务过程仿真分析、业务过程优化、业务过程管理与集成,从而最终实现业务过程自动化的核心技术。早期的工作流应用系统都是集中式的,即由一
物流在现代社会中起着很重要的作用,为了实现高效物流管理,必须做到物流企业间信息流的快速畅通。各物流企业信息化建设程度和方式的差异,导致各信息系统间的数据交换产生诸
H.264是目前流行的视频压缩编码国际标准,基于H.264的运动估计研究一直是视频压缩中研究的热点。与以往的标准如MPEG-1/2/4及H.261/H.263相比,H.264的编码效率有了大幅度的提