英语词汇歧义及英汉机器翻译中词义消歧上下限研究

被引量 : 0次 | 上传用户:hf4057
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机理解语义是五十余年来计算机科学家和语言学家一直致力解决的问题。目前,自动分词、自动词性标注的结果已经可以接受,而计算机对词义的理解正确率较低,在自然语言处理中是亟需跨越的障碍。而词义消歧的良好结果将影响自然语言处理的方方面面,如机器翻译、文本分类、信息提取等等。当前词义消歧总体上取得的结果并不令人满意,这也制约了自然语言处理的进一步发展。本文首先探讨并指出了影响英语词义消歧结果的消歧重点;通过测试给出了英汉机器翻译词义消歧的上下限;最后实现了一个已有的英汉机器翻译译词选择系统,并以之为例,分析了上述研究在实践中的作用。在进行词义消歧工作时,首先需要了解待消歧语言的词汇的歧义情况。本文利用一些可以获得的资源,包括传统字典、WordNet以及之前的统计研究,通过统计方法,分析了英语主要的开放词类——动词、名词、形容词、副词的歧义情况,指出解决英语词汇歧义的重点在于处理好常用动词、名词的最常用的几个义项。在英汉机器翻译词义消歧中,由于涉及双语,单语的词义消歧上下限不再适用,需要建立针对机器翻译的词义消歧上下限。本文通过统计WordNet中语义标注实例,得到了最大可能义项,并以之为词义消歧的下限;针对英汉机器翻译的独特特点,本文设计了调查问卷,通过计算人的义项选择之间的一致程度确定了英汉机器翻译中词义消歧的上限。上述两项研究的结果在实践中可以对英汉机器翻译系统中的词义消歧提供一定的指导性作用,所以最后,本文实验了一个现有的英汉机器翻译词义消歧算法,根据前述结果对不同的实验结果进行了分析,给出了改进的建议。
其他文献
以某财产保险公司云南分公司2015年-2018年人伤理赔诉讼案件的一手资料数据为基础分析该公司人伤理赔诉讼案件情况,对存在的问题提出发展建议。该公司存在问题有专业理赔人员
<正>全球视野的存款保险变革趋势金融危机促成国际存款保险协会通过《有效存款保险制度核心原则》金融危机的发生再次凸显了建立存款保险制度的必要性和重要性,而如何建立一
文章论述智能控制器无铅转移过程中,无铅工艺设计过程、参数设计的考虑以及工艺的优化方法。
压裂作业产生的压裂返排液对环境有极大的危害。文章针对某油田压裂返排液浓度高、难降解的特点,找到一套切实可行的"混凝—氧化"处理方案,通过实验确定最佳处理条件,最终出
针对战场环境下GPS信号易被欺骗干扰的缺点,提出了一种基于加权估计的紧组合导航滤波算法。该算法通过采用加权最小二乘算法先对GPS欺骗信号进行预估计,然后将得到的估计状态
基于棒束通道注水再淹没系统,提出重力注水方案,运用RELAP5/MOD3.2建立其再淹没模型,模拟从棒束底部依靠重力注水再淹没高温棒束通道时的骤冷现象。模拟结果显示:再淹没的过
辽宁省科技型中小微企业不仅是当前保持经济平稳健康发展的重要基础,同时也是推动地区经济转型、实现创新的重要力量。虽然近年来国家陆续推出一系列扶持政策助力科技型中小
本文提出了转轮与热泵联合运行的空调系统,利用热泵来完全满足系统的制冷和再生要求。对热泵子系统的匹配性及整机系统性能进行实验与模拟研究。同时对变风量运行方式下,转轮
共识问题是现代多元社会实现社会团结和社会统一必须认真思考的重大问题。本文从政治学的规范取向和经验取向梳理了西方古代社会、现代社会和当代社会共识观念演变的内在逻辑
目前,河北的医药卫生体制改革虽取得重要进展,医疗卫生服务的覆盖面、供给水平和服务质量都有了很大提升,但总体看,它与河北经济社会协调发展的要求不相适应的矛盾仍然比较突