论文部分内容阅读
汉字的正确与工整评价,对于辅助汉字自动化教学具有重要意义。在汉字自动化教学中,对汉字智能评分,发现书写问题并提出改进意见等既能给学生提供实时的评价反馈,也能减轻教师工作量。已有的汉字工整性评价多采用统计方法,对汉字进行粗略的评价或者评分,如漂亮、良好或差,远不能满足汉字自动化教学对评价的需求。受此启发,本文研究了基于结构替换对楷体汉字的工整性进行评分与评价的方法,从基于标记的特征提取,基于特征相似度的汉字工整性评分,基于结构替换方法优化汉字工整性评价以及实验验证这四个方面展开研究。为了降低特征提取的难度,本研究设计了一种基于标记的特征提取方法。首先通过专家预测法确定能够代表汉字的特征及权重,形成能被计算机识别的特征集。其次,根据笔画类型以及编码建立笔画库,根据笔画库以及笔画间的关系建立部件库,根据部件库以及部件间的关系建立汉字库。然后,在提取特征前,需要对汉字的原始点集进行预处理以减少干扰,包括剔除飞点、降噪和平滑。改进提取笔画拐点算法,提取笔段。最后根据汉字库、部件库、笔画库中的标记提取汉字、部件间、部件、笔画间、笔画特征。通过上述特征提取的方法,分别提取用户与标准模板汉字特征集合。通过比值法或者差值法,计算相似度以及相应的相似度等级。根据上述权重,得到特征权重集合。根据相似等级和权重集合,计算单个特征所扣分值以及最终汉字得分。提出基于结构替换的方法改进汉字工整性评价。由于汉字特征之间的关联性较强,评价出现一定程度的关联重复,因此提出结构替换的方法反过来利用这种特征。首先,根据所扣分值对特征进行排序,提取前5条特征集合。然后,替换其中的每个特征,得到分数集合,将得分最高的特征所对应的建议加入评价集合中,替换该特征,进行下一轮的循环迭代,直到评价集合中有5条建议才结束。实验表明,本文的工整性评价方法对汉字评分以及提出相关建议具有一定的效果,但仍需改进算法。