面向专利文本的单语模板的自动获取方法

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:lxkeinsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于模板的机器翻译方法在专利文本的自动翻译中具有广泛的应用。由于专利文本的术语繁多,并且分布极不均匀,因此在使用统计方法获取翻译模板时通常会产生严重的数据稀疏问题。本文提出一种专利文本的单语模板的自动获取方法,这种方法充分利用了专利文本中词汇分布极不均匀的特点,通过统计词汇出现的频率来识别出模板的固定部分和可泛化部分。实验结果证明,这种方法在专利文本的模板的自动获取上具有非常好的性能。 Template-based machine translation methods have a wide range of applications in automatic translation of patent documents. Due to the variety of terms and the uneven distribution of patent documents, there are often serious data sparseness problems when using statistical methods to obtain translation templates. In this paper, a method of automatic acquisition of monolingual template of patent text is proposed. This method makes full use of the feature of extremely uneven word distribution in patent texts, and identifies the fixed part and the generalizable part of the template by counting the appearance frequencies of the words . The experimental results show that this method has a very good performance in the automatic acquisition of the template of the patent text.
其他文献
烟草属于一种重要的经济型农作物,且我国烟草总产量和消费量均居于世界前列。每年在卷烟制作过程中都会产生大量的烟草废弃物,若能将这些烟草废弃物加以合理利用,不仅可以减
随着教育改革的不断深入和发展,在小学教育教学的实际过程中,以学生为学习主体、全面培养学生的学科核心素养和综合能力素质的教育教学理念越来越得到广大教师和家长的认可和
数学是研究数量关系、空间形式等反应规律的学科,若想在数学教学中了解图形的变化规律,就需要运用到几何直观。在解决数学问题的时候,几何直观能够借助图形对题目进行描述,通
由于国家对教育越来越重视,学校对学生的教学目标也大幅度提高,小学是学生开始正式接受教育的时期,是学生人生的重要阶段。语文作为小学时期的重点学科,对其他学科也有深远影
在学习语文的过程中,阅读能力是学生要掌握的基础技能之一。这不仅对于学生形成一定的判断能力和对事物具有自己独到见解的能力有帮助,同时对学生语言能力的提升也能起到积极
随着素质教育的发展,生物教学在初中教育中占据着越来越重要的地位,因而,初中生物教学活动的有效开展具有重要价值及意义。在初中生物课程教学中,为能够使学生的生物核心素养
端午节始于春秋战国时期,是华夏民族独特的文化符号。长江中游的“大小末端午”、“龙舟竞渡”、“送瘟神”和“浴百草汤”等风俗的产生与发展均与当地的文化息息相关。对清代
随着新课改的不断深化,教学方法也在不断变革中,创设问题情境也成为课堂教学中备受关注的方式。在初中数学课堂中创设问题情境,不仅有利于激发学生的学习兴趣,丰富他们的思维