朝汉混排古籍的文字切分方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:bibby_514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.
其他文献
农业部、财政部从2007年起启动现代农业产业技术体系建设,按照优势农产品区域布局规划,依托具有创新优势的现有中央和地方科研力量和科技资源,围绕农业产业发展需求,探索建立
煤矿及金属矿山大型箱型钢结构井架吊装施工中,采用滑轮系统二次平衡起吊施工技术,可解决井架起吊过程中,提升钢丝绳长度增加及直径加大带来的稳车容绳量受到限制及提升过程
期刊
(一)病原猪出血性大肠杆菌病是由出血性大肠杆菌引起的以拉稀症状为主的一种传染病。
平煤股份一矿一水平明斜井有260m处在地面重要建筑群下方,根据井筒施工所涉及的地面建筑物用途及地层情况的不同,采用了不同的施工方案,包括明槽法、注浆法、前探支护法、短段掘
7月27日,荣昌县畜牧兽医局、县商委、县工商行政管理局、县质监局在农业大厦702会议室召开专题会议,研究该县RFID猪肉溯源系统建设工作,标志着荣昌县生猪及其产品质量安全追溯系
时间同步网建设对于电力通信网发展具有极其重要的必要性.文章着重说明了建设时钟同步网的必要性,利用GPS系统建设同步网的设计原则和关键,从网络拓扑结构、时钟网同步方式、
结核病是由结核分枝杆菌(Mycobacterium)引起的人、畜、禽共患的一种慢性传染病,由人结核分枝杆菌(MTB)、牛分枝杆菌(MB)、禽型分枝杆菌(M,avium)、非洲分枝杆菌以及田鼠分枝杆菌(M,mi
10月15日至21日,中国共产党第十七次全国代表大会在北京召开。胡锦涛总书记在会上指出。这次大会的主题是:高举中国特色社会主义伟大旗帜,以邓小平理论和“三个代表”重要思想为
针对移动用户界面需在多种平台上重复开发的问题,借鉴模型驱动架构(Model Driven Architecture,MDA)思想,研究模型驱动的移动用户界面开发方法。用Mobile IFML(Interaction F