汉字书写美观度评价算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:NewMagic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像采集和视觉计算技术的蓬勃发展,各种信息和数据蜂拥而来,图像因其直观性和生动性,更是成为人们普遍使用的信息表达形式。计算机辅助的美观评价是人工智能领域最热门的话题之一,而对汉字图像进行自动美观评价的研究相对较少。在中小学生的语文教育中,汉字科目也开始进入中考大纲。本文在广泛查阅现有文献的基础上,重点研究了汉字书写的美观度评价方法,论文主要工作如下:
  (1)研究了汉字图像的预处理,提出了使用边缘保持滤波法进行去噪,通过实验证明,该方法既可以有效的去除脉冲噪声,又不会造成汉字图像的边缘模糊。在二值化过程中提出使用OTSU自适应方法既简单有效,又可以避免不同汉字样本闽值选取的偶然性。
  (2)研究了基于部首特征的汉字书写美观度评价方法,重点对汉字的凸盒、最小包围盒等全局特征进行定量分析,使用BP算法进行训练,按照一定的规则计算出每个汉字样本的机器打分,并将其与人工打分结果进行对比,验证该方法的可行性。
  (3)提出了基于PCA和SVM的汉字书写美观度评价方法。首先使用PCA对汉字图像进行主特征提取,得到白化矩阵和重构图像;其次使用SVM对汉字图像进行“优、良、中、差”四个评价等级的多分类,分析比较了各种SVM多值分类器的优缺点,选取“一对一”的构造方法。接着,对不同模型和不同核函数的SVM进行分组实验对比,证明了引入RBF核函数的C-SVM模型在本文方法中的有效性。
  (4)结合汉字笔画纹理明显的特点以及Gabor变换对局部纹理特征提取存在优势的理论,提出了基于Gabor变换和SVM的汉字书写美观度评价方法。首先,研究了Gabor滤波器不同参数的选择和意义,结合汉字以“横、竖、撇、捺”为主要笔画的特点,选取适当的方向参数对汉字进行Gabor纹理特征提取;其次,使用PCA对Gabor滤波后的汉字图像提取主特征以达到降维目标;最后,选取不同的训练样本组数,使用带有RBF核函数的C-SVM模型对样本做评级分类,并通过对比验证其对本文实验性能的影响。实验结果表明加入Gabor方法后对本文的美观度评价更为有效。
  本文使用传统方法针对汉字书写研究的新问题进行实验和探讨,同时也成为了这个领域的特色和创新之处。
其他文献
近年来,在嵌入式技术的推动下,可穿戴设备与可穿戴式系统得到了较大的发展。随着人们对于自身健康关注度的提高、对生活质量要求的提高和对电子产品接纳度的提高,与手表、服饰等日常用品相结合的可穿戴设备应用的研究成为当前国内外研究的热潮。而将可穿戴设备应用于医疗健康领域,逐渐得到人们的重视,尤其在我国老龄化逐渐增大的国情之下,设计与实现能够应用于日常健康检测的可穿戴式人体生理特征检测系统对于解决老年人的健康
共享单车于2014年开始爆发式地投放,解决了大学校园出行不方便的问题并不断向全体市民普及。虽然共享单车解决了城市居民出行问题,但共享单车爆发式的出现,共享单车的管理未能跟上步伐,共享单车的用户管理、定价结构、服务体系、运营资金管理、交通管理、停放管理以及维修管理等都诸多管理问题突显。本论文通过平台大数据分析,查找共享单车管理中存在的问题,优化服务体系、构建运营新模型,以细分市场、细分用户,实行针对
学位
随着云计算的日渐成熟,愈来愈多的用户把数据存储在云服务器上。由于云服务器不完全可信,保护数据的机密性同时提供查询的隐私性就成为云存储中的热点研究问题。可搜索加密技术的提出为云存储中这一难题的解决提供了可行的途径。然而,模糊关键词的可搜索加密,尤其是面向中文的模糊关键词可搜索加密仍然是值得深入研究的课题。  本文针对模糊中文关键词的可搜索加密方案展开研究工作,主要工作成果包括以下三个方面。  首先,
随着移动互联网的飞速发展,人们对基于位置服务的需求越来越强烈,室内定位技术越来越成为研究热点。室内定位在设备、人员的监控和管理等领域已经广泛应用。针对一种室内定位技术的定位精度不高的问题,本文研究了WIFI和蓝牙技术融合的定位方法。  首先,针对基于WIFI的位置指纹算法在室内定位中的关键问题进行了分析,室内复杂环境下WIFI信号强度波动较大,指纹特征和匹配算法是影响算法精度的两大因素。具体研究中
学位
近年来,随着自动化技术的不断出现,越来越多的公司去关注“测试数据、用例设计自动化”以及“测试结果分析、定位、质量自动化”等。目前,对于大型复杂软件,人工检测很容易漏测,需要一个全自动的测试系统,能够通过计算,快速的覆盖程序所有逻辑,得到输入输出,从而辅助人工生成大量测试用例,同时发现一些软件缺陷。但是,自动化测试的前提是测试用例的自动化生成。因此,尽可能代码全覆盖、简单实用、性价比高的测试用例自动
数据挖掘技术因为能够从海量数据中获得潜在的、正确的、有价值信息而成为研究热点。关联规则挖掘是数据挖掘的核心研究分支之一,而频繁模式挖掘作为关联规则挖掘的一个关键步骤,更具有研究价值。然而屡次发生的隐私泄露事件,给数据挖掘中的隐私保护带来极大的威胁,由于添加了隐私保护,挖掘效率已经成为大多数隐私保护的频繁模式挖掘算法的瓶颈。因此,提高隐私保护频繁模式挖掘算法的效率成为迫切需要解决的问题,并且数据库的
学位
在数据挖掘技术中,聚类分析是一个重要的组成部分。它是一种无监督的分类技术。使用聚类分析技术,数据分析人员可以从数据集中获取到数据隐含的、有价值的信息。由于社会信息化的推动,使得需要进行聚类运算的数据量迅速增长。原有的传统聚类分析方式已不足以应对当前的数据规模,针对这个问题,目前流行的Hadoop分布式大数据处理平台,为聚类分析的发展和研究提供了强有力的支持。  本文针对传统聚类算法在大规模数据上执
学位
为了保障企业和个人在云服务器上存储数据的安全及用户隐私,数据通常以密文的形式存储在服务器上。在关键词可搜索加密中,当用户检索存储在云服务器上的密文数据时,用户指定搜索令牌,服务器搜索用户感兴趣的密文,但服务器不知道用户搜索的关键词。基于属性的加密(ABE)可通过用户的属性实现细粒度的访问控制,当日仅当用户属性满足预先制定的访问策略时,该用户即可解密密文。将基于属性的防问控制机制与关键词可搜索加密相
学位
随着计算机与互联网技术的发展,应用程序逐渐从桌面向Web端迁移。Web端不仅提供了通用的用户操作界面、用户协作及与其他在线服务集成等功能,同时也可以避免应用程序在本地计算机上进行复杂的安装和配置。因此,基于云服务器的集成开发环境(WebIDE)越来越受到开发者的关注,并逐步得到应用。本文研究并实现了一个基于Openstack的WebIDE系统,对在线集成开发环境的研究与应用进行了有益的探索。论文的
随着微型低功耗传感器技术的飞速发展和不断成熟,基于传感器的应用系统在日常生活中随处可见,为我们的工作和生活提供了诸多便利。与基于计算机视觉的行为识别不同,基于传感器的方法更能体现人体运动的本质特征,而且不受特定的场景和时间限制,保护用户隐私,数据获取自由,信息量丰富,且体积小、灵敏度高、设备简单,因此基于传感器的行为识别已经成为一个新的研究热点,受到国内外学者的高度关注。  近年来,虽然基于传感器
学位