【摘 要】
:
本文研究和实现了对专利发布中的特殊字符的自动识别,这些特殊字符包括希腊字母和一些不常用的汉字,是在汉王产品识别的基础上进行的二次识别。
本文首先在理论上分析了系
论文部分内容阅读
本文研究和实现了对专利发布中的特殊字符的自动识别,这些特殊字符包括希腊字母和一些不常用的汉字,是在汉王产品识别的基础上进行的二次识别。
本文首先在理论上分析了系统的可行性,然后初步设计了一套基于BP神经网络的字符识别系统。该系统对样本图像进行了二值化、归一化等预处理,为特征提取做好了充分的准备。特征提取则设计采用了网格特征和投影特征相结合的混合特征提取方法,即考虑到了字符的全局特征又兼顾到了局部特点,为好的识别率打下了良好基础;本文在BP网络分类器的设计上做了大量的研究工作,即参考了前人的宝贵经验又根据实际试验选择了好的改进方案,在这一部分详细的介绍了BP网络输入层、隐含层和输出层的结构设计过程,网络各参数的设置过程还有误差准则函数的设计过程。本文最后一部分对整个系统的程序设计和性能分析进行了描述。程序设计过程介绍了预处理与特征提取、BP网络分类器的训练、用BP网络进行识别的程序设计和数据库的操作,给出了设计流程图和主要函数代码。文中介绍了用专利文献中的希腊字母和汉字图片对系统进行的训练和识别测试,并通过测试结果说明该系统对有稍微变形的字可以识别正确,而且对汉字的敏感度较高。
其他文献
安阳火柴广关心通讯员的成长。厂里为通讯员订阅了《新闻爱好者》杂志,并建立了通讯员档案。今年七月,他们利用学校放暑假,聘请郑州大学新闻系安阳电大班的学生,用八天时间
基于电学敏感原理的过程层析成像技术采用空间敏感阵列,以非接触或非侵入方式获取被测物场的分布信息,可以提供被测物场分布的实时信息,是实现可视化检测的核心技术。截面数
阿克苏地区推广棉花地膜覆盖新技术和更换棉花优良新品种以来。出现了小面积单产皮棉三百多斤的高产典型,纤维品质也有明显提高。为了积极调整种植业结构,发挥自然资源优势
传统电压源型逆变器属于降压式逆变器。在某些特定的应用场合,为获得较高的输出电压,必须增加额外的Boost升压电路。这种两级变换式电路拓扑不仅降低了装置的可靠性和效率,而
辽单17号.该玉米杂交种为辽宁省农业科学院育种所以“V_a35”为母本,“辽轮814”为父本杂交育成,1988年6月经辽宁省农作物品种审定委员会审定,命名推广。该品种幼苗叶鞘紫色
五、作物优化配方施肥技术我省推广配方施肥是采用效应函数法与养分丰缺指标法相结合的方法,即采用单因素或二因素三水平田间正交回归设计的试验为基础,将不同处理得到的产
太康县委正副书记和县长都亲自写新闻稿件。去年,县委书记张军同志发现农民对经营土地的积极性不高,并认为这在全省都有一定代表性,于是根据太康县的经验教训,总结出三点保
看了贵刊今年第五期《读者之声》栏中《短写精编惜字如金》一文的几点建议,我们农民拍手叫好。新闻短一些,我们农民在工余饭后,农时闲暇的几分钟时间读上几段,就能了解到更
语音端点检测是语音分析、语音合成和语音识别中的一个必要环节。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时由于噪声的引入和环境的
浙江定海县广播站从海岛众多分散的实际出发,先后架设了二十七条飞海线和十条飞山线,总长达五万三千多米,从而使全县二十七个岛屿都能收到县站讯号,实现了“乡乡通广播,村村