利用平行网页建立中英文统计翻译模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:felltwo23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立翻译模型的目的是试图从平行文本(或翻译例句)中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中,我们尽量利用文本中的HTML结构信息。实验表明,所训练的翻译模型能达到80%的准确率。对于象跨语言信息检索这样的应用,这样的准确率已经能大致满足需要。这一工作表明,对于检索引擎上的问句的翻译可以使用比机器翻译成本更低的工具。
其他文献
现阶段,大学生就业问题已经成为我国关注度较高的一个问题,而大学生面对严峻的就业形式也引发了一系列心理问题,这些心理问题在很大程度上成为了阻碍大学生顺利就业的因素之一。
《权力与荣耀》是格雷厄姆·格林最为重要的宗教主题小说。虽然以往的评论家对《权力与荣耀》的主题做过各种研究,但是较少关注作品中传统天主教思想因素与反传统天主教理
目前我国对教育越来越重视,随着九年义务教育的实施,高校的入学率日益增长,这让各高校的发展规模逐渐壮大,财政收入也不再是依靠财政的集体拨款了,开始呈现出多元化的财政收入,因此
课堂教学时实施素质教育的主渠道,素质教育观念下的英语教学应该是一种全面发展的教育。随着社会发展对高素质人才的需求,如何转变教育观念、改进教学方法、弃旧汲新是课堂教学
书面表达是一个“积句而成章”的过程,是综合语言运用能力的一种体现。句子语义学强调主要动词是句子意义的主要载体,是句子的核心,强调主要动词与情景参与者的关系;信息结构理论
本文介绍了中文信息处理技术发展的现状及面临的主要困难,指出:关键在于对现代汉语研究的滞后。到目前为止,中文信息处理主要依赖于对大规模语料的统计,根据概率,对词与词的关系作
为提高Visual Basic程序设计教学效果,总结了第一堂课的教学思路方法。首先通过教师自己开发的管理系统及小游戏介绍Visual Basic程序设计的实用性,然后按软件工程思想,以“求爱
以一起农村雇凶杀人棠为切入点,在解析了涉案人员的个人情况后,又调查了他们及当地部分农民的法律、权利和责任意识状况。认为他们的现状,源于当前农村处于发展转型期和管理服务
微博作为一种新的信息分享和传播方式以其鲜明的独特性引起关注。文章以标记模式为理论框架,对微博中出现的语码转换进行观察和分析,探寻出微博中语码转换的特点及其社会功能。