基于E-A-V结构的汉语语义概念图构建与匹配研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:wenzhen881219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分析是自然语言处理研究的一项重要工作。与印欧语言不同,汉语中词类与句法成分没有严格对应关系,导致传统基于句法的语义分析方法不适宜于进行中文语义分析。概念图是一种已被证明优于经典的人工智能知识表示方法的语义知识表示方法,用概念图来表示中文的概念语义,将为中文语义信息处理研究提供新的思路。由于汉语是义符文字,以名词为中心,其表述语义的方式往往是通过词与词之间的耦合,表达概念之间的直接耦合关联,因此有必要在传统概念图基础上研究适合汉语语义表示的汉语内涵语义概念图。本文首先在传统概念图表示模型的基础上,提出面向汉语语义分析的内涵语义概念图表示模型,针对汉语句法分析存在的困难,采取弱化句法分析、注重概念内涵分析的策略,提出基于概念内涵分析的汉语内涵语义概念图生成过程,并针对现有概念图匹配不准确的问题,提出一种新的概念图匹配算法。本文的主要研究工作如下:一、针对汉语句法分析存在的困难,采取弱化句法分析、注重概念内涵分析的策略,在汉语概念内涵逻辑模型的基础上,提出一种适合汉语语义表示的汉语内涵语义概念图表示模型。二、在汉语内涵语义概念图表示模型的基础上,提出基于概念内涵分析的汉语内涵语义概念图生成过程。首先通过对基本概念进行分析,生成基本概念图;然后以复合结构的中心概念为核心,利用基本概念图进行概念图合并,形成复合概念图;最后对复合概念图进行简化。三、针对现有汉语语义计算中,概念图匹配计算存在不准确的问题,提出一种基于E-A-V结构相似度的概念图匹配算法。该算法以汉语概念内涵逻辑模型为基础,以内涵语义概念图为知识表示方法,结合E-A-V结构相似度计算方法,进行概念图匹配。实验结果表明该算法在概念图匹配上取得了较好的效果。四、在基于E-A-V结构的概念图匹配算法中,概念图的相似度是由E-A-V结构相似度求算术平均值得来的,针对此问题,在匹配算法中引入概念子图权重自适应调整机制。此算法在进行概念图相似度计算时,依据概念子图中包含的信息量占整张概念图信息量的比例赋予子图相应的权重。实验结果表明该算法能取得比原算法更好的效果。
其他文献
近年来,随着计算机网络和数字通信技术的飞速发展,分布式数据库的应用日益增加。所谓分布式数据库是指数据库中的数据在物理上是分布的但在逻辑上是一个整体的数据库系统,为了获
PDSN(Packet Data Services Node)是CDMA2000分组数据网络中的关键设备,主要功能是完成移动数据业务的接入,在移动通信网络和分组数据网络之间进行数据转发。就目前我国无线通
循环流化床锅炉具有燃料适应性广、截面热强度高、污染物排放少、锅炉负荷适应性高、燃料制备系统相对简单等优点。正是由于循环流化床锅炉具有如此多的优点,从而加快了循环
功能服装CAD中的三维仿真方法是当前三维CAD领域的一个研究热点问题。它涉及人体热循环、服装-人体热湿传递过程及包含神经生理和心理方面的热舒适度反应等物理生理过程的计
近年来,随着Internet上数据的爆炸式增加,国内外信息化建设也掀起了前所未有的高潮。由于信息化建设中或缺乏统筹规划或新旧信息系统同时存在,造成了各种不同信息系统共存的情况
作为新兴的无线传感器网络具有十分广阔的应用场景,包括军事、环境监测、目标追踪、科学观察和预报等领域。然而在实现各种网络协议和应用系统时,存在着一些现实约束。比如传感
IMS(IP Multimedia Subsystem)是3GPP在Release 5版本提出的支持IP多媒体业务的子系统,主要采用SIP(Session Initiation Protocol)协议进行会话控制。通过IMS,3G(3rd Generatio
RIA(Rich Internet Application,富因特网应用)是集桌面应用程序的最佳用户界面功能与Web应用程序的普遍采用和快速、低成本布署以及互动多媒体通信的实时快捷于一体的新一代网
入侵检测系统是计算机安全体系中的一个重要组件,它监控针对主机或网络系统的恶意行为,并及时给出报警和响应处理。近年提出的将对等结构应用于分布式入侵检测系统中的思想,为解
在苏州水环境信息系统的开发中,遇到3个值得进一步研究的问题,即:如何更好地解决异构数据库间的数据“翻转”问题;如何实现表现能力更强、操作更灵活的用户界面;如何进一步完善现