【摘 要】
:
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能。但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,
【机 构】
:
中国科学院自动化研究所模式识别国家重点实验室
【基金项目】
:
基金项目:国家自然科学基金资助项目(60575043,60736014),国家863计划资助项目(2006AAOtZl94,2006AA010108)
论文部分内容阅读
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能。但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得到充分的利用。为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法。对于不存在于短语表中的短语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句子,在此基础上对所有扩展的句子进行翻译。由于并不是所有扩
其他文献
病原体、肿瘤细胞在与宿主的相互作用中,为求生存可建立一系列免疫逃避机制以抵抗机体免疫系统的攻击.其中对MHC-Ⅰ类分子限制性抗原呈递途径进行干扰则被认为是内源性抗原(
目的观察参麦注射液治疗肺心病的临床疗效.方法将62例肺心病患者随机分成治疗组和对照组,每组各31例,2组常规综合治疗相同,治疗组在综合治疗基础上加用参麦注射液,治疗前后分
目的探讨胃类癌的诊断、病理学特点及治疗选择.方法回顾性分析1989~2003年14年间21例胃类癌的临床资料.结果21例胃类癌中,1例患者术前经胃镜病理证实为胃类癌,有1例出现恶性类
现代社会已然是一个高风险社会刚刚过去的2011年,注定是不平凡的一年。我们不妨来看看国际上的一些“大事件”。1月14日,突尼斯总统本·阿里在民众的示威抗议声中逃往国外,