论文部分内容阅读
双语库对齐是自然语言处理研究的重要课题之一。其中,双语库段落对齐是指出源文和译文中对应的翻译段落的对齐过程。它上承篇章对齐,下接句子对齐,在整个双语库的对齐中起着承上永下的重要作用,但由于种种原因,双语库段落在当今研究中没有受到应有的重视。直接进行通用的段落自动对齐具有相当的难度,也不必要,鉴于此,提出将段落对齐转化成分段对齐进行实现。通过汉英词汇对之间的特征比较,首先找到可以用于汉英双语库分段的