一个基于混合语言模型的日文识别后处理系统

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文字识别系统中,为了进一步提高文本识别率,后处理模块是很重要的环节。文章针对日文的语言特性,建立统计方法和规则相结合的混和语言模型,实现了一个日文识别后处理系统。该系统首先利用Viterbi算法得到统计模型输出的最优结果,通过与前端识别器输入的识别结果相比较,确定可疑字位置,再利用上下文词匹配方法和语法规则库的使用对可疑字进行检错和纠错处理。经实验验证,该后处理系统对识别日文印刷体文本错误率平均下降21.4%。
其他文献
牛奶中的功能因子和免疫活性物质很多.其化学本质也各有不同,蛋白质类有免疫球蛋白、乳铁蛋白等.脂肪酸类有CLA等。牛奶蛋白质在营养上具有极重要的意义.乳蛋白质直接参与机体蛋
目的探究食管癌狭窄及食管瘘患者临床治疗中行胃镜下食管支架置入术的临床效果。方法择取2014年1月-2018年7月期间在广东省梅州市人民医院接受治疗的240例食管癌狭窄及64例食
青年教师的专业能力提升受自身内部因素和外部环境的双重影响,自身因素是其专业能力提升的根本动因,外部因素是青年教师专业能力提升不可缺少的必要条件。作为学校要明确促进
"学好数理化,走遍天下都不怕",由此不难看出化学学习的重要性,随着近代教育教学的改革,教学方式发生了很大的变化,现阶段高中化学的概念教学在高中化学教学中有着举足轻重的
<正>汽车行业迅猛发展的同时汽保企业也得到了快速发展,但随之而来的专利侵权等问题也给汽保企业带来一些困扰。本文整理了部分与汽保企业专利侵权及专利保护等相关的问题,希
<正>随着外包服务业的发展,金融服务外包市场正在逐步形成。银行业金融机构充分利用社会资源,将非核心业务实行外包,可提高金融机构的核心竞争力,规避经营风险和降低经营成本
21世纪以来,城乡居民收入差距不断扩大、消费需求严重不足,这在很大程度上制约了城乡经济的协调发展。本文分析了陕西省城乡居民收入差距与消费水平的现状,采用实证分析方法,
针对我国城乡收入差距日益扩大的现实背景,本文从不同角度,在新兴古典经济学的框架下,通过超边际分析思想,理论论证了我国现阶段处在半专业化分工结构中人均收入水平非均等化
本文首先论述了区域活动与集体教学活动整合的概念,然后说明了区域活动与集体教学活动整合的重要性,最后研究了区域活动与集体教学活动整合对幼儿发展的贡献意义,即从有利于