基于多信息融合的中文手写地址字符串切分与识别

来源 :电子与信息学报 | 被引量 : 19次 | 上传用户:aspbasicer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种有效的中文手写地址字符串的切分与识别方法。首先,利用笔划提取与笔划合并将字符串图像进行过切分,得到"字根"图像序列;然后综合利用几何信息、识别信息和语义信息挑选最优的"字根"合并路径,得到最优的切分结果及对应的最优识别结果。其中,几何信息是根据当前字符串自身的特点统计得到,因此可适应不同书写风格的字符串。识别信息由单字分类器给出,包括10个候选识别结果及其相应的置信度;单字分类器采用MQDF分类器。语义信息用基于字的bi-gram模型进行描述,模型参数是从包含18万条地址数据的数据库中
其他文献
据日本福冈九州大学的一个研究小组透露,他们已研制出一种基于激光的pH值传感器,其灵敏度至少相当于一个荧光装置。据报导,这种传感器包括一个对pH值敏感的百里酚酞凝胶光栅
1999年时,北京市海淀区人民法院审理了中国第一起网页侵权案——“瑞得在线”主页案。原告瑞得公司诉称:被告东方信息公司的主页在整体版式、色彩、图案、栏目设置、栏目标题、文案、下拉菜单的运用等方面都几乎是照搬“瑞得在线”网站主页,侵犯了其公司的著作权和商业信誉。被告东方信息公司辩称:原告主页所采用的设计版式并非原告所独创,该主页的“色彩、栏目设置、栏目标题、下拉菜单”等均属公有领域的“思想表达形式”
1月12日,中国计算机学会计算机安全专业委员会(以下简称专委会)召开第二次常务委员会暨新春联谊会,近50名常务委员及代表汇聚一堂,一同回顾了2008年专委会主办的各项会议及活动,并对2009年的工作进行了筹划和安排。公安部网络安全保卫局局长、专委会荣誉主任顾建国、中国工程院院士、专委会主任方滨兴、专委会特聘副主任沈昌祥出席会议并祝词。
梁实秋事件得出的教训,除了议题设置一方没严格按"学术民主"的程序出牌外,其在大众文化传播学意义上的教训必须深刻检讨。这就是:在大众媒介的强势宣传之下,如果掌控舆论强势的
近日,怡海软件针对Salesforce CRM在应用情况在北京召开客户关系管理系统(CRM)研讨会。本刊了解到,基于Force.com平台的Salesforce CRM,为市场上最快捷、最具弹性的客户关系管理方
乡村文化振兴是乡村振兴的题中之义,乡村文化治理是乡村社会治理的重要内容。寻求乡村文化治理的路径,需要挖掘传统文化所具有的当代价值,关注植根于乡土社会的乡村文化,分析
韩国电信部门监管机构韩国通信委员会近日表示,韩国政府2009年将投入6.88万亿韩元(约合53.6亿美元),用于支持电信企业发展下一代电信服务以及采购新设备。韩国通信委员会在向总统李
网络购物概念及其优点 网络购物就是出卖人通过网络媒体发出要约并交付标的物、买受人对要约作出承诺并支付价款的一种商品交易主式。网络购物与传统的钱物直面交易方式相比