基于混合核Ls-SVM的古汉字图像识别

来源 :安徽大学 | 被引量 : 0次 | 上传用户:hellolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国古汉字记录了大量的政治、经济、历史等资料,具有很高的史料价值。古汉字具有笔划不规则、异体字繁多等特点,以碑刻和帛书等形式出现的古汉字,残损较为严重,上述特点使得古汉字识别非常困难。利用图像处理技术识别古汉字,解决古籍电子化进程中的流通和典藏困难,对民族文化的继承和发展具有重要的意义。  由于古汉字的异体字与局部形变大量存在,现有的图像识别方法难以获得准确结果。支持向量机具有小样本下的强泛化与抗噪能力,在图像识别中已被广泛应用。本文将混合核最小方差支持向量机(LS-SVM)结合图像特征抽取、曲波变换等实现古汉字的图像识别,主要工作和结论如下:  1.针对古汉字间的高度相似性导致误分类率高的问题,对传统的支持向量机进行改进,采用混合核加权LS-SVM进行分类识别。混合核加权LS-SVM可以减少异常样本的负面影响,避免出现分类越好或者越坏点的惩罚也越大的情况,提高分类的准确率。  2.研究了时域多特征融合的特征提取方法。提取部件结构特征与整体广义密度特征作为全局特征,该全局特征具有鲁棒性强和算法复杂度低等特点;提取网格笔划特征与伪二维弹性网格内的局部点密度特征作为局部特征,所提的局部特征对于局部形变有很好的吸收能力。将提取的全局特征和局部特征融合后作为分类器的特征输入。  3.针对古汉字笔划多为不规则曲线导致分类率不高的问题,利用二代曲波变换提取古汉字的频域特征,研究了频域多特征融合的特征提取方法。采用快速离散二代曲波变换对古汉字图像进行多分辨率分解,对不同分辨率下的古汉字图像求取灰度共生矩阵,得到各层子图像的纹理特征参数,然后将所有子图的特征参数进行多特征融合,形成高维的特征向量,并对此特征向量抽取主成分,作为分类器的特征输入。仿真实验结果验证了该方法的有效性。
其他文献
随着计算机的迅速发展,三维重建技术一直是计算机视觉和计算机图形学的研究热点。三维重建技术在医学研究、建筑设计、数字城市、机器视觉和文物保护等方面有着广泛的应用。
随着信息技术的飞速发展,使得将计算、通信、网络与传感等功能都集成在一个设备成为可能,无线传感器网络就是这些技术紧密结合的产物。集成有传感部件、微处理器和通信模块的
IPv6相对于IPv4有着巨大的优点,势必在将来得到更广泛的应用。但由于目前网络上几乎都是IPv4设备,所以从IPv4过度到IPv6必定是一个渐进的过程。NATPT则是由此而产生的一种实现I
TETRA数字集群系统提供安全、可靠以及高效率的语音和数据通信,在全球许多国家得到了广泛的应用,在我国多个行业也使用TETRA数字集群系统。目前,我国所使用的TETRA数字集群设
电力线通信(PLC,Power Line Communication)是利用电力线作为通信媒质来传输数据信息和话音信号的一种通信方式。由于电力线通信具有组网容易和成本低廉等优点,因而具有很高
压缩传感理论是一种新颖的信号采集与处理的理论,该理论指出:对于稀疏或可压缩的信号,可以采取比Nyquist低得多的采样频率进行数据采样,通过使用恰当的恢复算法仍能准确的重构
随着网络业务量的爆炸性增长以及高性能的光网络设备(如光交叉连接器、光分插复用器等)的出现,波分复用(WDM)技术成为下一代骨干网络的核心技术。由于网络中存在多种类型的业务,
目前,射频识别技术(RFID)作为一种能够实现物品供应链操作,商品跟踪和存货控制的技术正广泛受到关注。随着射频识别技术在物体标识方面应用的成熟,人们正在致力于兴建一个全
在配电自动化中,实时数据库和实时性要求到处可见,而实时数据库一般通过数据库通信中间件来对外提供访问支持。为此数据库通信中间件需要具备一定的实时性。针对性的对数据库
在下一代无线通信技术中传统蜂窝用户能够在基站的协助下进行设备间(device-to-device,D2D)直接通信以实现用户间的视频共享。然而,考虑到用户终端设备能量短缺,D2D视频共享