一种具有英汉辅助翻译功能的拼音输入法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wmr8232123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拼音输入法不仅具有易学易会的特点,而且拥有相当多的用户。目前市场上的拼音输入法一般是以词为单位进行输入的,具有拼音串可编辑和汉字串可编辑、混合输入、模糊输入、机器学习、特殊处理、自动转化(智能化)等特点,比较典型的有:微软拼音输入法、紫光输入法、拼音加加输入法等。机器翻译是指通过计算机来实现不同自然语言之间的翻译,现正逐渐成为克服不同语言交流障碍的重要手段。目前基于统计的方法已经成为机器翻译研究领域的主要研究方向之一。统计机器翻译可以利用海量语料库直接训练得到机器翻译系统,具有无需人工干预、译文质量机械味道少等优点。通常的拼音输入法重码率高,面向普通用户使用,而对专业从事翻译的人群来说,这些输入法则忽略了行业的特殊性和便利性。基于统计的机器翻译技术在整句或成段英文翻译效果方面差强人意。将拼音输入法和统计机器翻译技术结合起来,不仅可使拼音输入法具有辅助翻译功能,而且通过专业翻译人员和拼音输入法的交互,也可改善统计机器翻译中英文句子的翻译质量,产生符合专业翻译人员的要求的译文。基于上述思想,本文开发了一种供专业翻译人员使用的交互式翻译工具——具有英汉辅助翻译功能的拼音输入法。该工具从专业翻译人员的翻译思路出发,将目前已有的拼音输入法、基于统计的机器翻译和n元组统计技术结合起来,从而减少了翻译人员的击键次数,节省了翻译时间。本文的创新之处如下:1、依据专业翻译人员的思路,提出了英汉双语句子中词汇模糊对齐模型,利用该模型可估计翻译人员当前预翻译单词的译文,排除单词翻译的歧义性。2、以英汉双语句子中的词汇模糊对齐为基础,将汉字拼音输入法和基于统计的机器翻译技术结合起来,估算翻译人员想要的字词,供翻译人员确认选择,从而减少击键次数,产生高质量的译文。
其他文献
将传统观念中模糊的“测试”概念在软件的开发过程中明确化、规范化,提出了软件设计、软件编码和软件维护分别与测试设计、测试编码和测试维护同步的思想。详细分析了测试用例
网上购物由于具有方便快捷、成本低、效率高、选择性强等优点,已经被越来越多的人所接受,并成为一种不可忽视的商业形式。然而,在网上购物的最初阶段,消费者为了找到满意的商品,往
近年来,数据挖掘的研究得到了快速发展,数据挖掘的成果已经广泛地被运用到了许多行业。时态数据挖掘是数据挖掘研究的一个重要的组成部分。时态特征聚类作为时态数据挖掘的一个
随着Internet的发展,越来越多的高带宽需求的多媒体应用带来了带宽的急剧消耗和网络拥挤问题。多播是一种介于单播和广播通信之间的数据传输方式,它提供了一种一到多或者多到
PLC技术、网络技术及数字设备的不断发展,促使工业控制从传统的模拟控制逐步走向数字控制,从分散控制走向集中控制,从人工操作发展成为计算机控制。计算机软硬件技术已经渗透到
车载监控终端集全球定位技术,移动通信技术和地理信息系统技术于一身,它不但是智能交通系统的重要组成部分还能实现许多安全防范功能。 本文通过对GPS卫星定位理论、卫星数
分布式关联规则挖掘研究是为解决分布式环境下的关联规则挖掘问题而出现的新课题,具有重要的理论和实际意义。概念格通过概念的内涵和外延之间的关系以及泛化和例化之间的关
随着信息技术的高速发展,综合了计算机技术、网络技术和通信技术的嵌入式技术己成为人类继PC和互联网之后最热门的技术。嵌入式技术的应用已经广泛渗透到我们的工作、生活中,特
近年来,可靠性正在成为体系结构研究领域越来越重要的研究点。现在已经有很多可靠性模型可以用来在体系结构层次上预测软件的可靠性,但是绝大部分工作都没有给出软件体系结构的
随着网络的发展和人们对通讯业务需求的不断增长,传真、文本、图像和语音视频等各种各样的新业务层出不穷,尤其是VOIP(Voice Over IP)业务的发展非常迅速。这些业务突出的特点