【摘 要】
:
随着网络的广泛应用和科技的高速发展,人们所接收信息急剧增加,机器翻译面临强大的市场需求。从现存文本资料中提取语言模型,是整个机器翻译系统的重点,决定了翻译系统的性能表现
【机 构】
:
上海交通大学自动化系,上海现代语言研究所
【基金项目】
:
国家自然科学基金(60574063)项目基金资助项目
论文部分内容阅读
随着网络的广泛应用和科技的高速发展,人们所接收信息急剧增加,机器翻译面临强大的市场需求。从现存文本资料中提取语言模型,是整个机器翻译系统的重点,决定了翻译系统的性能表现。用于特定领域的文本翻译系统,往往受到相关文本缺少的困扰,无法通过大规模语料库的建设来训练语言模型,由此而产生了严重的数据稀疏问题。通过实验研究了受限语料库下语言模型平滑算法的选择。实验结论表明,在语料库极度受限的情况下,Good-Turing能够发挥其低频词汇重估优势,良好解决训练语料库的数据稀疏问题。通过该方法,可以提高在语料受限条件下
其他文献
目的:研究甘露丝(一种魔芋食品)对高脂血症及糖尿病患者脂、糖代谢的影响.方法:采用成组设计,测定患者干预前后甘油三酯、总胆固醇、高密度脂蛋白胆固醇及空腹血糖、糖化血红
设计了一种用于光纤传感的新型非对称法布里-珀罗(F—P)干涉腔。干涉腔由固定在石英毛细管的两根镀膜光纤构成,该干涉腔改善了普通F—P腔的反射响应特性,有助于提高传感器的灵敏
根据1997年和2010年2期Landsat TM影像数据,运用遥感监督分类方法得到榆林市近13a土地利用分类图;应用GIS空间分析技术,采用定量和定性相结合的方法,对榆林市能源基地建设以
本文从五个方面讨论了全球化背景下边疆社会稳定研究的现状、存在问题及其可能的研究思路。指出全球化背景下边疆社会稳定是一个动态稳定,由于全球化背景下以及我国当今国家化
为了配合我校实施卓越工程师教育培养计划,笔者在电工电子基础核心课程建设过程中,以强化学生的工程应用能力和创新意识为宗旨,在"电子技术"课程中试行了以案例教学为主要教学
同学之间时常讨论一些问题,话题很广。一次在讨论“班门弄斧”时,形成了两种对立观点。一种认为,“班门弄斧”是在行家面前卖弄本领,想出风头;而另一种则认为,“班门弄斧”
程序公正是实现实体公正的基础,行政程序不仅是行政机关认定事实作出决定的认识过程,同时也是一个价值选择的过程。在一定条件下,把价值问题转换为程序问题来处理是打破政治僵局
随着我国社会主义市场经济的发展和企业改革的深入,企业的各项资产业务迅猛发展,出现了因资产转让、企业兼并、企业出售、企业联营、股份经营、中外合资合作、企业清算、企业
本文以高中物理竞赛参赛者角度分析了杨氏模量概念、实验装置调节和实验技巧,并通过两种实验数据处理方法阐述了实验机理,为后续参赛者提供借鉴。
本文通过对过盈联接装配过程中压装力与压装位移之间关系的讨论,得出了多段过盈联接情况下采用压装力-位移曲线判断装配质量的智能判断方法。同时对各种典型曲线进行分析判断