适用于特定领域机器翻译的汉语分词方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:WXH6165559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高。这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量。为解决这个问题,该文实现了基于生语料的领域自适应分词模型和双语引导的汉语分词,并提出融合多种分词结果的方法,通过构建格状结构(Lattice)并使用动态规划算法得到最佳汉语分词结果。为了验证所提方法,我们在NTCIR-10的汉英数据集上进行了评价实验。实验结果表明,该文提出的融合多种分词结果的汉语分词方法在分词精度F值
其他文献
从代表低、中、高三个煤化阶段的三对共生样品的可溶组分的色谱质谱(GC/MS)联机分析的结果看,饱和烃的组成,在腐泥煤和腐植煤两个变质系列中始终存在明显差异。比如腐泥煤的碳数
根据娘子关泉群系统西部控水构造、含水层段、水动力场等水文地质条件,重新划定了娘子关岩溶水系统西部边界(兴道-大方山-郭家沟一线构造带),则东山区成为娘子关的一个补给径
项目管理是一门实践性与综合性较强的课程,是管理学的一个分支学科,随着国家经济的发展及社会的进步,项目管理成为了众多高校热门的课程。但是在高校的项目管理教学中仍旧存
本文通过对当前工会畅通职工诉求表达渠道的现状及问题的调查研究及深入分析,结合遂宁市的一些做法,提出了着力构建职工诉求表达渠道的新理念、新方法、新路径。
<正>模糊语言是近年来汉语研究中出现的一个新领域,人们对语言的模糊属性进行了多方面的探讨,其中尤以阐述词语的模糊特点为多。问题是,当人们论及词语的模糊性时,常常把自己
期刊
目的:评价综合运用中药与体针治疗神经性耳聋耳鸣的临床疗效。方法:针药并用对120例神经性耳鸣患者进行辨证论治,并进行疗效评价。结果:有效率为90%。结论:针药并用治疗神经