【摘 要】
:
汉英统计机器翻译中,汉语语料通常需要使用中文分词将句子切分成词序列。然而中文分词不是为统计机器翻译而开发的技术,它的分词结果不能保证对统计机器翻译的优化。近些年,一些
【机 构】
:
哈尔滨工业大学教育部—微软语言语音重点实验室
【基金项目】
:
基金项目:国家自然科学基金资助项目(60736014),国家863计划资助项目(2006AA010108)
论文部分内容阅读
汉英统计机器翻译中,汉语语料通常需要使用中文分词将句子切分成词序列。然而中文分词不是为统计机器翻译而开发的技术,它的分词结果不能保证对统计机器翻译的优化。近些年,一些研究试图改进中文分词方法从而达到对统计机器翻译的优化。在该文中,从另外的角度研究中文分词对统计机器翻译的影响。基本思想是利用多分词结果作为额外的语言知识,提出一种简单而有效的方法使这些知识为统计机器翻译所用,使用了一系列策略融合多分词结果,并将融合结果应用在统计机器翻译系统中。实验结果表明这种方法比没有使用多分词结果融合的系统提高1.89个B
其他文献
矢量字以其可以方便地进行各种变换和高质量的显示及输出效果得到广泛应用,汉字的矢量化是中文信息处理的重要内容之一。该文通过非细化的矢量化算法中的轮廓线的方法,针对启功书法字中的3 755个一级汉字完成了矢量化,并建立了包括每个字的笔画的矢量表示、笔画顺序等信息的启功书法的矢量字库,为启体书法的逐笔临摹学习奠定了基础。文章详细论述了对书法字轮廓的提取过程,笔画分割过程和对提取结果的优化处理方法。
雪花蟹斗 原料:大闸蟹6只,鸡蛋清4只,姜末、香醋、盐、味精、胡椒粉、绍酒各少许。 制法: 1.大闸蟹煮熟过冷水后拆出蟹肉、蟹黄、蟹盖洗净留用。鸡蛋清抽打成蛋泡糊待用。 2.
<正> 上海市区酿造行业有九家生产厂和一家研究所,主要产品有四大类,即酱油、食醋、酱类及饴糖。这些产品都是以粮食为原料,前三类是经微生物发酵酿制而成,饴糖则应用酶制剂
目前,自动语音识别系统往往会因为环境中复杂因素的影响,造成训练环境和测试环境存在不匹配现象,使得识别系统性能大幅度下降,极大地限制了语音识别技术的应用范围。近年来,
<正> 酱渣、碱糟、醋糠是酿造行业的下脚料,数量大,仅上海酿造六厂、上海醋厂每年产生约1万吨。这些废糟一般只能作为粗饲料使用,利用效率低,有的还是急待解决的三废。经过我
<正> 固定化活细胞具有含辅酶在内的完整酶系,在适宜的条件下,活细胞可大大增殖,完成一系列复什的生化反应。我们采用包埋法分别固化醋酸菌和酵母菌活细胞,发酵生产食醋。该
<正> 生料制醋是近几十年发展起来的新工艺,其工艺的主要缺点是:麸曲用量大、辅料与填充料用量多、发酵周期长、工作效率低与劳动强度大。为了进一步简化工艺,工程技术人员先
采用DQS—1催化剂,在Spheripol工艺(含气相釜)装置上进行了抗冲共聚聚丙烯EPS30R树脂的生产,考察了DQS-1催化剂的立构定向能力、氢调敏感性及乙丙段序共聚性能,并对生产的树脂产品
为了研究露天矿边坡岩体的变形和破坏特征,论文应用弹塑性三维有限单元数值分析方法,分析计算了各种模拟方案的应力、位移及安全率的变化规律,对小龙潭布沼坝露天矿西北边坡岩体
韩国人对竞技体育非常重视。刚刚卸任总统职位的李明博曾发表评论称,韩国已经发展成为名副其实的体育强国,许多项目虽然未能(在2012伦敦奥运会上)取得奖牌,但也足以让世界对韩国刮目相看。 为了展现良好的国家形象,从韩国总统到韩国平民个个都是一副斗志昂扬的面孔,而他们的运动员和裁判,更是在许多重要赛事中给世界人民留下深刻印象。如果说整容是韩国的潮流,跨国企业是韩国的心脏,音乐是韩国的耳朵,那么,体育就