一种利用校对信息的汉字识别自适应后处理方法

来源 :中文信息学报 | 被引量 : 10次 | 上传用户：hghyxx_0918

【摘要】

：

后处理技术是汉字识别系统的重要组成部分。传统的识别后处理技术在很大程度上依赖于所训练的统计语言模型 ,没有考虑所处理文本的特殊性 ;而且没有利用识别器的动态识别特性。本文利用部分校对过的正确本文信息 ,一方面可以构建自适应语言模型 ,及时发现所处理文本的语言特点 ;另一方面可以利用识别器的动态识别特性 ,以修正候选字集 ;从而使得后续文本的识别后处理具有自适应性。 40万字的数据测试表明 :这种方

【作者】

：

李元祥刘长松丁晓青

【机构】

：

清华大学电子工程系

【出处】

：

中文信息学报

【发表日期】

：

2001年01期

【关键词】

：

汉字识别修正候选字集自适应语言模型文本平均错误率动态识别特性校对信息 Chinese character recognition postproces

【基金项目】

：

国家高技术研究发展计划(863计划)，国家自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

高职高专应用电子专业《普通物理》课程改革探析

提出高职高专应用电子专业《普通物理》课程存在的问题，并剖析原因，提出改革的思路和具体措施．

期刊

《普通物理》课程体系实践教学理论教学

一种利用校对信息的汉字识别自适应后处理方法

其他学术论文