论文部分内容阅读
语义排歧是揭示和描述准情态动词have(got)to在具体语境中所拥有的语义和句法特征,并判定其具体含义的重要方法和手段。目前已取得了丰硕的成果,并被广泛的应用到自然语言处理中。因此,其在自然语言处理,机器翻译,文献检索,语音识别,语言学领域都具有重要意义。情态作为表达人类情感、态度的重要手段,其语义具有不确定性。Coates(1983)在The Semantics of Modal Auxiliaries中将情态语义的不确定性分为梯度,歧义,重合。本文主要研究基于语义排歧的英语准情态动词have(got)to在不同语义梯度限制下的语义与句法特征的分布特点。本文首先对准情态动词have(got)to语义进行划分。采用250万字语料库进行标注,并计算准情态动词与邻近主语和谓语的互信息。研究提取了have(got)to的12类语义特征和4类句法特征进行排歧。本研究分别利用训练组200个样本和检验组150个样本建立形式背景,建立准情态动词have(got)to排歧模型。训练组自检正确率为91.5%。通过提取的规则对检验组进行检验,得出检验组排歧模型的正确率为81.3%。证明了形式概念分析的方法对准情态动词have(got)to语义排歧是有效的。情态动词语义不确定性梯度是指情态动词从一类语义逐渐过渡到另一类语义的语义连续统,语义之间没有明确界线。这一连续的渐变意义即情态语义从核心意义到边缘意义的逐渐过渡,形成了情态动词的语义梯度。基于形式概念分析的理论,本研究对Lyons and Coates(1980)中对情态动词语义梯度的划分进行了归纳和调整。从人为因素限制的维度将准情态动词have(got)to语义梯度划分为四个级别:人类的限制,人类制度限制,人类精神准则限制和自然法则限制。提取了影响其语义梯度的9个句法特征和3个语义特征,并以这些特征为属性,以抽取的120个例句为对象,建立形式背景。利用属性偏序图的原理,构建语义限制梯度模型。通过提取规则,研究了不同梯度条件下属性特征的分布特点和不同规则对语义梯度的限制作用。通过交互多尺度查看图,分析上下层属性分布对语义梯度的限制作用。研究结果显示:施事动词和受事动词分布于图的上层,具有包涵功能。心理动词、have(got)to的三个语义倾向于分布在图的底层,具有具体分类功能。RNhave(got)to在自然法则梯度中出现频率最高,而ROhave(got)to ENhave(got)to在自然法则梯度中却极少出现。ROhave(got)to在人类制度梯度中出现频次最高。ENhave(got)to在人类精神准则梯度中出现次数高于其它两个语义。第二人称主语对人类的限制语义梯度影响最大,第三人称主语在自然法则和人类制度语义梯度中出现频率高。第一人称主语对人类精神准则影响较大。施事动词在人类的限制语义梯度中出现最多,相对而言,受事动词在自然法则语义梯度中出现最多。随着人类因素对语义限制的减少,有生命主语减少,无生命主语增多。本文基于形式概念分析的理论和方法对英语准情态动词have(got)to的语义排歧及不同语义梯度下语义与句法特征研究,不仅丰富了情态动词的研究范畴,也为影响语义特征的知识发现研究提供重要借鉴意义。