论文部分内容阅读
针对日汉机器翻译问题,提出一种新的独立于具体机器翻译算法的两层翻译架构.第一层优先利用信息检索和双语语料实现翻译记忆;第二层充分利用日语的自然形态特性,在句法匹配和词汇记忆基础上支撑高级翻译.该架构的效力依赖于大规模日汉语料资源和高效的句法匹配算法.网络语言大数据爆发在一定程度上缓解了日汉语料资源的匮乏,而平假名符号子系统表示的句法框架显式标记可以支持高效句法匹配算法的实现.实验结果表明把日语自然形态特性融入日汉机器翻译,能够创新翻译架构、扩充语料规模、降低训练开销.