基于机器翻译的中文语义解析

来源 :东南大学 | 被引量 : 0次 | 上传用户:lipengzhangchinese
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义解析是指将自然语言句子转化成计算机能推理的逻辑表达式。近年来,英文语义解析方面的工作硕果累累,有很多语义解析方法被相继提出。其中,基于机器翻译的语义解析方法已经在英文语义解析任务上取得了诸多不俗的成果。但是,目前中文语义分析方面的研究主要集中在信息抽取、语义角色标注等浅层的语义分析任务上,语义解析方面的工作很少。中文与英文之间存在一定的差异,适用于英文的语义解析方法不一定适合中文,因此本文尝试将基于机器翻译的语义解析方法应用于中文语义解析任务。主要工作包括:1)将英文语义解析数据集GEOQUERY翻译为中文。英文的GEOQUERY数据集包括880个自然语言句子及其对应的逻辑表达式,为了构建中文语义解析的数据集,将其人工翻译成中文。因为中文分词会影响后续的语义解析结果,所以对翻译后的数据集中的自然语言句子进行了人工分词。2)将基于机器翻译的语义解析方法应用于中文语义解析任务,提出了中文语义解析模型(Chinese Semantic Parsing Model, CSPM)。在中文GEOQUERY数据集上进行实验,中文语义解析模型解析结果的F1值为63.35%,说明可以利用基于机器翻译的语义解析方法来处理中文语义解析任务。3)针对中文语义解析模型的解析结果中许多逻辑表达式不符合规范的问题,本文加入语言模型来筛选解析得到的逻辑表达式,提出了改进的中文语义解析模型(Improved Chinese Semantic Parsing Model, ICSPM)。在中文GEOQUERY数据集上进行实验,改进的中文语义解析模型解析结果的F1值为75.60%,说明加入语言模型来筛选逻辑表达式能够有效地提升中文语义解析模型的性能。
其他文献
模型驱动体系结构是OMG在2001年提出的一种新的软件方法学,它将系统功能规约与特定技术平台的功能实现规约相分离,以达到“一次设计,任何平台实现”的目的。 本文扩展了对
借助于No.7信令网和大型集中式数据库的支持,移动智能网将网络的交换功能和控制功能相分离,把网络中各网元的智能集中到新的功能部件——由中小型计算机组成的SCP(Service Co
无线传感器网络作为一种新兴的技术,已成为当前国际上备受关注的研究热点,被认为是对21世纪产生巨大影响力的技术之一。路由协议的研究是无线传感器网络的一个重要研究领域,其中
近年来随着我国高速铁路动车组的大规模投入使用,借助于先进的传感器技术、数据采集技术和计算机存储技术,动车组积累了海量的数据。利用这些海量数据进行数据分析,从而指导维修
随着Internet的高速发展,全球数据业务呈爆炸式增长。数据业务动态、突发等特性对传统的光传送网(OTN,Optical Transmission Network)提出了更高的要求。自动交换光网络(ASON
本文通过分析电子商务环境中信任的需求,设计了优先信任模型PRTM (Priority trust model),对电子商务中信誉计算进行了研究,并在完全竞争的电力市场中应用信誉计算。首先,PRT
随着航空运输市场竞争的激烈,航空公司对航段运量预测的工作越来越重视。对于航空公司来说,航段运量预测关系到其对未来发展、运力安排和市场拓展等做出重要决策,关系到其科
Web已成为了网络信息的主要平台,是人们获取信息的重要来源。但是,由于Web页面的无结构性、超链接的自由无序以及Web内容的海量性、多样性和动态变化,人们从Web上搜索真正想要的
随着数据库技术的成熟应用和Internet的迅速发展,从大量数据中挖掘有用的信息成为一个迫切需要解决的问题,数据挖掘的研究应运而生。数据挖掘经常要面对一些有噪声、杂乱、非
特征提取和描述是基于特征的图像处理和计算机视觉的基础环节,特征检测算子的检测性能和描述算子的表针性能直接决定了图像处理的效率和精度。在实际问题中图像可能受到噪声