论文部分内容阅读
计算机处理自然语言关键是识别语言,而自然语言的多义性与复杂性使计算机识别语言的难度增大。汉语疑问词的疑问用法和非疑问用法的使用环境的复杂性就属于这类难题。本文运用优选论对汉语疑问词的语义解读进行了系统分析,确立了优选论评估器内的四个制约条件及其等级排列顺序。我们尝试将分析结果应用到汉语疑问词机器翻译中去,以此来提高疑问词的识别效率。第一章介绍了本文选题的背景及意义,即汉语疑问词的对译性问题是机器翻译领域的难题,目前尚未有有效的识别模型。综述了前人对汉语疑问词的研究,提出了本文研究的理论基础(优选论、语法系统中的局部性与显著性)和研究方法。第二章分析了汉语疑问词的疑问解读,分别从汉语疑问词的句法位置变化与句义的关系和句末语气词“呢”“吧”“吗”的疑问程度排序的角度进行了分析(即“呢”<<“吧”<<“吗”)。第三章分析了汉语疑问词的非疑问解读,包括存在解读和全称解读。表存在解读的疑问词出现在是非问句、正反问句、条件性复句、非事实类动词句等真值不确定环境中,以及否定句、反问句等否定性环境中;表全称解读的疑问词往往被“都”“全”“也”约束,也可以出现在光杆条件句中。第四章对汉语疑问词的语义解读进行了优选分析,提出了汉语疑问词的解读方案。在总结了影响汉语疑问词解读的“吗”规则、"V+Neg.+V"规则、条件性复句规则、显性否定规则、副词类算子规则、双疑问词规则、隐性否定规则、非事实类词语规则、“都”的重音分配规则等显性隐性关键项后,得出了汉语疑问词优选分析的四个制约条件及其等级体系,即“标记性算子制约条件>>非断言环境制约条件/否定性环境制约条件>>必然疑问制约条件”。第五章将汉语疑问词优选分析的结果应用到了汉英、汉德疑问词机器翻译领域中,并给出了汉语疑问词的识别模式。第六章在总结本文要点的基础上,提出了研究的不足之处,也就是部分疑问词的特殊用法未列入我们的研究法范围之内。我们的后续研究是将总结的疑问词的识别模式应用到机器翻译的实践中去。