基于缝隙裁剪的满文单词分割和提取方法研究

来源 :中文信息学报 | 被引量 : 2次 | 上传用户:dgjjtjn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。
其他文献
随着日本养蚕业的急剧衰落,其蚕茧产量逐年下降,1989年产量为2.68万吨(比1988年下降9%),1990年产量估计只有2.3万吨,而1991年预计只有2万吨。日本政府为满足国内需求,今年准备
迭代反演内插管法是一种线性反演算法。该方法依据一组规则进行内插,它允许引入一系列层面约束条件,如使用一种简单的方式定义层面上的断层,该方法就可以识别并风格化不连续的层
机器阅读理解是自然语言处理(NLP)领域的一个研究热点,目前大部分的研究是针对答案简短的问题,而具有长答案的问题,如描述类问题是现实世界无法避免的,因此有必要对该类问题
胜利油区低渗透油田开发中含水及注水问题对开发有重要的影响,研究指出,延长无水和低含水采油期是开发好低渗透油田的关键,分析了油藏见水后采液指数下降的原因.文中还研究了河流
塔里木盆地塔中4井区石炭系CI油组为石英砂岩类碎屑岩储层.通过对该区3口井的岩芯、薄片观察及有关资料分析,识别出了压实压溶作用、胶结作用、溶解作用、交代作用及自生产矿物的形
江苏泰兴县化工印染机械厂吸收西德先进技术,最近研制成功了CN-150型程控染色机。10月20日,轻工部工艺美术总公司为该机在山东威海地毯一厂主持召开了应用座谈会。
张燕虽然在其他行业有着3年的管理经验,但刚接手的这家美容院管理不到两个月,却陷入了危机之中。除了业绩上不去,下属的几名美容师表面上看起来对她毕恭毕敬,但对她的要求却
由淮北第一棉纺织厂承担研制的1584台布机电子计算机监测系统,经过两年时间的研制施工和一年时间的实际运行,最近在淮北市通过了省级鉴定验收。
“若不是长时间被冷落,就民众自身而言,他们更希望成为新型城镇化建设的主角而不是一名看客。”  作为第一届中国民生发展论坛协办单位的掌门人,广州市容大生物技术有限公司(以下简称容大生物)董事长韩敏在论述“新城市化下的企业机遇与社会责任”议题时,所持观点被点评为“直抒胸臆、亲民一派”。  在论坛上,韩敏认为,在以政府为主导的新型城镇化建设过程中,政策的制定者以及城市的管理者决不能脱离民众,相反要去影响
全国苎麻纺织科技情报站于今年9月5~8日在山东青岛召开了第五次年会。针对苎麻纺织工业面临的困难,会议提出了加快苎麻纺织工业发展的四条建议: