古今汉语对齐研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户：pp

【摘要】

：

双语对齐是当前机器翻译中的一个重要研究课题，对于自然语言处理的一些其它任务，例如双语词典构建、词义消歧等也有很多的应用。双语对齐在英法、英汉等语言对中已有很多的研究

【作者】

：

林准

【机构】

：

北京邮电大学

【出处】

：

北京邮电大学

【发表日期】

：

2007年01期

【关键词】

：

句子对齐子句对齐长度信息汉字信息动态规划

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

双语对齐是当前机器翻译中的一个重要研究课题，对于自然语言处理的一些其它任务，例如双语词典构建、词义消歧等也有很多的应用。双语对齐在英法、英汉等语言对中已有很多的研究，但是在古代汉语和现代汉语之间的自动对齐研究还没有。本文针对古代汉语与现代汉语语料，分别研究其在句子和子句两个层次的对齐。在古代-现代汉语句子对齐中，论文根据古代汉语与现代汉语双语文本的特点，建立了一个综合长度信息、模式信息和汉字信息的对齐模型，模型使用动态规划算法在逐段对齐的古今文本中发现代价最小的句子对齐序列。实验结果表明，这种方法能达到92％以上的句子对齐精度。本文对多种信息源的组合情况，以及各种容易引起对齐错误的情况进行了进一步的分析。由于子句对齐能获得更为细粒度的对齐信息，为以后词的对齐和结构对齐提供更好的基础，本文进一步研究了古代汉语和现代汉语的子句对齐，在子句对齐中，本文采用和句子对齐类似的方法，依据子句的语料特点进行了算法的参数调整，实验中得到了超过93％的对齐精度。通过与句子对齐的比较，进一步讨论了不同的统计信息给对齐结果带来的不同的影响。

其他文献

理解结构概念,认识结构作用r——单元2:数据结构的教学建议

在明确了数据的内涵与外延、理解了数据的价值与作用之后,对数据间存在的某些特定的关系需要进行必要的研究,也就是对数据结构进行研究,以提高数据存储效率及运算效率.

期刊

教育漫谈:r2020诺奖给予的启示

2020年度诺奖的发布适逢小长假,也就有了更多的时间吃瓜看热闹.当然,在吃瓜之余也是感慨良多.rn例如,反复刷屏的诺奖得主——两位女科学家的获奖感言.rn10月7日,诺贝尔化学奖

期刊

财政补贴政策与企业研发创新r——基于创业板上市公司的实证研究

通过建立面板数据模型与采用2012—2017年中国创业板上市公司微观数据,研究财政补贴政策对企业研发创新的影响以及区分不同行业和地区来分析影响的异质性.其中企业研发创新活

期刊

财政补贴研发投入创新产出异质性面板分析

于平常处见深入r——一段教材研读随笔

最近看到一本德国卡尔斯鲁厄市的初中物理教材(浙江陈敏华老师翻译,广东教育出版社2018年出版),发现里面竟然有关于信息的知识主题.个人感觉其内容组织和知识呈现非常有功力,

期刊

OTHR数据处理关键技术研究

现代战争对雷达反辐射、反隐身、反低空突防和抑制杂波等性能的需求使得天波超视距雷达(Over the Horizon Radar，简称OTHR)在远程轰炸机和洲际导弹的早期预警中发挥更重要的作

学位

天波超视距雷达航迹融合性能评估系统设计与实现

信息技术教学中同质性协同教学模式的研究r——以制作“智能警示牌”为例

● 核心概念界定rn2017年7月,国务院印发的《新一代人工智能发展规划》中指出,“利用智能技术加快推动人才培养模式、教学方法改革,构建包含智能学习、交互式学习的新型教育

期刊

新冠肺炎疫情下旅游评论主题内容特征r——以150篇文章为样本

为了解旅游各界对疫情冲击旅游业的评价及应对策略,对旅游企业实施自救、政府制定相关政策、旅游业转型升级,促进旅游业快速复苏及长期健康发展提供重要参考;运用内容分析法,

期刊

影响复苏发展旅游业新冠肺炎疫情

曲线结构检测在斑马鱼生物图像研究中的应用

随着后基因组时代的到来，为了研究基因组的功能、基因与显形之间的关系、生物药物的开发以及系统生物学等，现代生物学实验需要通过高通量高内涵的生物成像设备产生海量图像及相

学位

生物图像斑马鱼曲线检测Dijkstra最短路径算法Hessian矩阵

古今汉语对齐研究

其他学术论文