论文部分内容阅读
随着图像采集和视觉计算技术的蓬勃发展,各种信息和数据蜂拥而来,图像因其直观性和生动性,更是成为人们普遍使用的信息表达形式。计算机辅助的美观评价是人工智能领域最热门的话题之一,而对汉字图像进行自动美观评价的研究相对较少。在中小学生的语文教育中,汉字科目也开始进入中考大纲。本文在广泛查阅现有文献的基础上,重点研究了汉字书写的美观度评价方法,论文主要工作如下:
(1)研究了汉字图像的预处理,提出了使用边缘保持滤波法进行去噪,通过实验证明,该方法既可以有效的去除脉冲噪声,又不会造成汉字图像的边缘模糊。在二值化过程中提出使用OTSU自适应方法既简单有效,又可以避免不同汉字样本闽值选取的偶然性。
(2)研究了基于部首特征的汉字书写美观度评价方法,重点对汉字的凸盒、最小包围盒等全局特征进行定量分析,使用BP算法进行训练,按照一定的规则计算出每个汉字样本的机器打分,并将其与人工打分结果进行对比,验证该方法的可行性。
(3)提出了基于PCA和SVM的汉字书写美观度评价方法。首先使用PCA对汉字图像进行主特征提取,得到白化矩阵和重构图像;其次使用SVM对汉字图像进行“优、良、中、差”四个评价等级的多分类,分析比较了各种SVM多值分类器的优缺点,选取“一对一”的构造方法。接着,对不同模型和不同核函数的SVM进行分组实验对比,证明了引入RBF核函数的C-SVM模型在本文方法中的有效性。
(4)结合汉字笔画纹理明显的特点以及Gabor变换对局部纹理特征提取存在优势的理论,提出了基于Gabor变换和SVM的汉字书写美观度评价方法。首先,研究了Gabor滤波器不同参数的选择和意义,结合汉字以“横、竖、撇、捺”为主要笔画的特点,选取适当的方向参数对汉字进行Gabor纹理特征提取;其次,使用PCA对Gabor滤波后的汉字图像提取主特征以达到降维目标;最后,选取不同的训练样本组数,使用带有RBF核函数的C-SVM模型对样本做评级分类,并通过对比验证其对本文实验性能的影响。实验结果表明加入Gabor方法后对本文的美观度评价更为有效。
本文使用传统方法针对汉字书写研究的新问题进行实验和探讨,同时也成为了这个领域的特色和创新之处。
(1)研究了汉字图像的预处理,提出了使用边缘保持滤波法进行去噪,通过实验证明,该方法既可以有效的去除脉冲噪声,又不会造成汉字图像的边缘模糊。在二值化过程中提出使用OTSU自适应方法既简单有效,又可以避免不同汉字样本闽值选取的偶然性。
(2)研究了基于部首特征的汉字书写美观度评价方法,重点对汉字的凸盒、最小包围盒等全局特征进行定量分析,使用BP算法进行训练,按照一定的规则计算出每个汉字样本的机器打分,并将其与人工打分结果进行对比,验证该方法的可行性。
(3)提出了基于PCA和SVM的汉字书写美观度评价方法。首先使用PCA对汉字图像进行主特征提取,得到白化矩阵和重构图像;其次使用SVM对汉字图像进行“优、良、中、差”四个评价等级的多分类,分析比较了各种SVM多值分类器的优缺点,选取“一对一”的构造方法。接着,对不同模型和不同核函数的SVM进行分组实验对比,证明了引入RBF核函数的C-SVM模型在本文方法中的有效性。
(4)结合汉字笔画纹理明显的特点以及Gabor变换对局部纹理特征提取存在优势的理论,提出了基于Gabor变换和SVM的汉字书写美观度评价方法。首先,研究了Gabor滤波器不同参数的选择和意义,结合汉字以“横、竖、撇、捺”为主要笔画的特点,选取适当的方向参数对汉字进行Gabor纹理特征提取;其次,使用PCA对Gabor滤波后的汉字图像提取主特征以达到降维目标;最后,选取不同的训练样本组数,使用带有RBF核函数的C-SVM模型对样本做评级分类,并通过对比验证其对本文实验性能的影响。实验结果表明加入Gabor方法后对本文的美观度评价更为有效。
本文使用传统方法针对汉字书写研究的新问题进行实验和探讨,同时也成为了这个领域的特色和创新之处。