论文部分内容阅读
准情态动词是指大量存在于现代英语中的形式上区分于情态动词但与其语义密切的迂说情态形式,常见的准情态动词有be able to,be going to,have to,have got to,need to等。同核心情态动词相比,准情态动词易被忽视,相关研究较少,这与其日益增长的使用频率并不协调。语义排歧是自然语言处理中的重点难点课题之一,其主要针对同形异义词如形容词、介词、情态动词等,通过给定的参数如语境信息、句法特征,计算机智能地识别出最贴切的语义。本文以英语准情态动词be able to为研究对象,在语义排歧的基础上进行知识发现研究。基于形式概念分析理论,利用属性偏序图工具,以250万字自然语言语为语料,对英语准情态动词be able to进行语义排歧研究。首先确定语料中be able to的三个语义:“能力”,“可能”和“允许”;然后基于训练组215个样本,构建语义排歧模型,得到自检正确率88.37%;同时通过检验组110个样本检验出排歧正确率94.55%;最后进行规则提取及属性特征分析,研究表明:be able to的三个语义都受与之搭配的主语和动词影响,也与句法特征有关联,但句法特征的影响远不及语义特征影响大;同一语义下的规则具有相似性,不同语义下的规则大不相同。基于be able to的语义排歧模型,开展了知识发现研究。发现在与be able to共现的情态动词中,核心情态动词出现频率远远多于准情态动词。通过分析频率最高及频率最低的情态语义组合,总结出情态动词与be able to共现的语义组合规律,即由第一个情态语义到第二个情态语义经历了一个语义主观性由强到弱的变化,即主观性强的语义倾向于靠前排列。此外,本文对情态连用现象的功能进行了分析,发现该连用结构体现出说话人既表达主观态度又考虑客观因素的复杂情感,这是单一情态结构所无法取代的。最后,在情态共现限制关系中发现,第一情态多表现主观意义,第二情态多呈现客观意义,且语义的主观性越强,其出现情态共现的几率越高。本文对准情态动词be able to的研究,不仅拓展了情态动词研究的语义范畴,对自然语言处理研究具有指导意义。