论文部分内容阅读
机器翻译在经历了长达几十年的发展和演变之后,随着信息技术和计算机技术的不断提高,对机器翻译的研究已经由当初简单的语言学与计算科学相结合的学科慢慢转变为融合了语义学、数学、语料库、计算科学、人工智能和生物科学的一个综合性研究领域。然而时至今日,机器翻译的译文质量依然不能达到人们所期望的水平。尤其是在长句处理问题上,尽管计算机等相关科学已经较十几年前有了质的飞跃,然而长句处理这一问题却依然是机器翻译研究领域中一个无法逾越的障碍。长句的处理不同于词的查询。词的查询只需要对所查询词进行词例还原并将还原词例与数据库中的条目进行比对搜索就可以轻易找到对应的译文,而其中词例还原所需要涉及的转换规则对于现有的技术水平来说是十分容易的。相比之下,要想进行长句的分析处理,则不仅需要进行词一级的信息比对,而且还需要对句子中的各种结构进行区分和关系辨别,这其中涉及到了歧义处理,词的远距离相关,句相关等一系列的问题,诸如从句中包含短语,短语中含有从句,主、从句被插入语隔开等情况。而所有这些复杂的句结构关系能否被成功识别并通过规则成功转换为正常语序的目标语言正是制约机器翻译发展的一个关键性课题。因为在英语的各类文献中,长达数行的英语长句极为常见,如果长句处理不好则会严重影响机器译文的质量和可读性。而随着我国经济和社会的日益发展,巨大的外文资料翻译需求面对的却是翻译力量的严重不足,这就严重影响了快速获取信息资源的效率。而要解决这一问题,机器翻译无疑成为了目前比较可行的方法!因此,机器翻译系统中如何正确处理英语长句的问题就成为了我国信息化战略的关键性问题。本文主要研究内容就是从对机器翻译的发展历史和其基本方法的研究入手,进而对现阶段的机器翻译系统中句分析方法进行剖析,而后对长句分析的系统结构和相关关键问题进行探讨。本文的第三章从长句分析的基本原则和方法、长句的定义和识别、长句分析难点和基本处理方法以及现有机器翻译系统中长句处理方式入手,对长句翻译的机器字典设计和结构进行了详细的分析研究。本研究还针对机器翻译系统中最重要的资源性结构——机器字典以及长句分析算法进行了试探性的改进,并通过实例展示加以说明。论文的最后一部分则主要阐述了研究者在进行相关学习和研究过程中对机器翻译所持有的一些观点和态度,同时对机器翻译的发展趋势及其可能产生的影响进行了尝试性的分析和预测。