基于概念网络的汉语语义复合研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:xiesd001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义复合研究是一项面向计算机的以解决短语语义理解问题为目标的工作,直接地涉及到语言学和计算机科学两个学科,是对信息内容进行语义理解的重要环节。本文以概念网络模型为基础,从语义的层面分析和归纳了中文短语复合的规律,建立了语义结构分析和语义关系计算的模型体系,运用语义关系分类和脚本描述的方法,试探性地设计了汉语名词性短语和动词性短语的语义结构及语义关系计算的解决方案,以此来理解概念及概念复合的意义,进而支持汉语短语语义复合的计算机理解。 首先,在介绍语义学、人工智能及自然语言理解等相关研究的基础上,确定了汉语短语语义复合研究的对象是中文短语,面向的主体是计算机,目标是建立语义结构分析和语义关系计算的模型。讨论了本研究的理论基础,概念网络。介绍了概念网络模型的基本结构、语义表达及语义计算的模型,并初步提出了对“意义”、基本概念、三种语义复合结构以及语义场模型的形式化表达方法。 其次,在概念网络模型及语义复合模型的基础上,探索了汉语名词性短语和动词性短语的语义分析方法。为名词性短语的复合计算建立了语义结构,使用语义约束刻画此类短语的复合结构及成分间的语义关系。建立了汉语名词性短语成分间语义关系的分类体系,定义了八种语义关系,提供了名词性短语结构划分正确性的语义判定方法。为动词性短语设计了复合结构的语义表达形式。对动词性短语的语义分类,划分出五种基本行为模式和六种基本语义角色,在此基础上提出了使用脚本来刻画谓词的具体语义功能的方法,一方面实现了过程知识的表达,另一方面解决了动词性短语的语义内容计算问题。 最后,从两个方面探讨了本文建立的语义复合模型的应用问题。一是参照句法体系,以汉语语法分析中常见的短语结构分类情况为参照,利用基本概念、语义约束、语义状态和语义逻辑四种语义单元,分析短语的复杂结构,通过实例比较,展现了本文提出的语义复合模型对汉语短语结构的表达能力,对这种复合模型的实用性做了较为有力的论证。二是在概念网络模型及语义复合表达模型的基础上,设计了汉语名词性短语复合的计算框架,分析并建立了名词性短语语义复合的计算机处理原型系统,并做了初步实验,通过实践检验了理论模型的可用性。
其他文献
随着传感器技术、嵌入式计算技术和分布式信息处理技术的迅速发展,无线传感器网络(Wireless Sensor Networks,WSN)应运而生。无线传感器网络具有的广阔应用前景,在基础理论和工
为了解决冠状动脉CT造影成像中冠状动脉血管腔及斑块区域的分割和量化问题,本文提出了两种基于参数化模型的分割算法,分别是基于三维参数化模型的分割算法和基于二维参数化模型
入侵检测作为一种积极主动的安全防护技术,提供了对内部攻击、外部攻击和误操作的实施保护,在网络系统受到危险之前拦截和响应入侵。然而现在的入侵检测系统面临着巨大挑战,随着
PC104工业控制计算机在国内嵌入式应用领域占据了较大的市场份额。但是,国内PC104产品的核心集成电路,如处理器和芯片组等,全部依赖进口。研究开发高性能工业控制计算机系统
互联网的出现改变了计算机世界,XML的出现改变了互联网。W3C组织公布的XML标准为各种不同类型的信息定义了一个统一的标准,XML的出现同时也给计算机领域带来了许多新的技术。
网格是下一代Internet上的计算平台,其核心任务是管理分布在Internet广域环境中的各种类型的数据与服务资源,并为基于Internet的分布式应用提供一个统一的、虚拟的共享资源的计
随着计算机网络技术的飞速发展,各种网络设备、网络协议和网络服务推陈出新。网络的维护和管理面临着新的挑战,传统的集中式网络管理已经不能满足这种大型复杂网络的需要。移动
随着计算机和互联网络技术的普及应用和飞速发展,业界的分析家估计,对存储容量的需求以后会以每年50%—100%的速度递增;对众多企业而言,由于其工作性质的要求,致使数据必须在
数控加工是CAM的主要组成部分,数控技术及计算机辅助设计的发展使传统的机械设计与制造发生了根本性的变化。在开发基于PMAC卡的数控加工上位机监控系统,完成对加工过程的实时
MMC卡(多媒体存储卡)是一种广泛应用的存储设备,它可以作为单片机系统的外存储设备。本文所讨论的用于单片机的MMC卡的文件系统,可以提供一组文件操作函数,通过调用这些函数,单片