古今汉语对齐研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:pp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语对齐是当前机器翻译中的一个重要研究课题,对于自然语言处理的一些其它任务,例如双语词典构建、词义消歧等也有很多的应用。双语对齐在英法、英汉等语言对中已有很多的研究,但是在古代汉语和现代汉语之间的自动对齐研究还没有。本文针对古代汉语与现代汉语语料,分别研究其在句子和子句两个层次的对齐。在古代-现代汉语句子对齐中,论文根据古代汉语与现代汉语双语文本的特点,建立了一个综合长度信息、模式信息和汉字信息的对齐模型,模型使用动态规划算法在逐段对齐的古今文本中发现代价最小的句子对齐序列。实验结果表明,这种方法能达到92%以上的句子对齐精度。本文对多种信息源的组合情况,以及各种容易引起对齐错误的情况进行了进一步的分析。由于子句对齐能获得更为细粒度的对齐信息,为以后词的对齐和结构对齐提供更好的基础,本文进一步研究了古代汉语和现代汉语的子句对齐,在子句对齐中,本文采用和句子对齐类似的方法,依据子句的语料特点进行了算法的参数调整,实验中得到了超过93%的对齐精度。通过与句子对齐的比较,进一步讨论了不同的统计信息给对齐结果带来的不同的影响。
其他文献
期刊
在明确了数据的内涵与外延、理解了数据的价值与作用之后,对数据间存在的某些特定的关系需要进行必要的研究,也就是对数据结构进行研究,以提高数据存储效率及运算效率.
期刊
2020年度诺奖的发布适逢小长假,也就有了更多的时间吃瓜看热闹.当然,在吃瓜之余也是感慨良多.rn例如,反复刷屏的诺奖得主——两位女科学家的获奖感言.rn10月7日,诺贝尔化学奖
期刊
通过建立面板数据模型与采用2012—2017年中国创业板上市公司微观数据,研究财政补贴政策对企业研发创新的影响以及区分不同行业和地区来分析影响的异质性.其中企业研发创新活
最近看到一本德国卡尔斯鲁厄市的初中物理教材(浙江陈敏华老师翻译,广东教育出版社2018年出版),发现里面竟然有关于信息的知识主题.个人感觉其内容组织和知识呈现非常有功力,
期刊
GPS全球定位系统,是随着科学技术的迅速发展而建立起来的卫星导航定位系统.GPS卫星定位测量是研究利用GPS系统解决大地测量问题的一项空间技术.随着全球定位系统(GPS)技术的
现代战争对雷达反辐射、反隐身、反低空突防和抑制杂波等性能的需求使得天波超视距雷达(Over the Horizon Radar,简称OTHR)在远程轰炸机和洲际导弹的早期预警中发挥更重要的作
● 核心概念界定rn2017年7月,国务院印发的《新一代人工智能发展规划》中指出,“利用智能技术加快推动人才培养模式、教学方法改革,构建包含智能学习、交互式学习的新型教育
期刊
为了解旅游各界对疫情冲击旅游业的评价及应对策略,对旅游企业实施自救、政府制定相关政策、旅游业转型升级,促进旅游业快速复苏及长期健康发展提供重要参考;运用内容分析法,
随着后基因组时代的到来,为了研究基因组的功能、基因与显形之间的关系、生物药物的开发以及系统生物学等,现代生物学实验需要通过高通量高内涵的生物成像设备产生海量图像及相