机打普通商业发票识别系统研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dflhe88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济和科技的持续高速发展,会计电算化已经基本普及并在商业活动中起到重要作用,但是鉴于经济工作的严谨性,经济往来中并没有实现无纸化办公,发票仍然是商品交易的法定记账凭证。我国幅员辽阔,计算机网络已经基本覆盖全国,因此把纸质发票承载的数据信息转化为计算机能够使用和存储的电子信息将给发票数据信息的传输、存储与查询带来极大的便利。传统的转换是依靠人工手动输入实现,但是随着发票数量的日益增多,此种输入方式需要投入更多的人力、物力、财力,而且容易出错,因而研究出一种能够代替人工的发票自动处理系统将十分有意义。针对机打普通商业发票这类交易中最为常见的票据,本文利用模式识别原理、OCR技术,设计和研究出机打普通商业发票自动处理系统,从而更好地推进会计的电算化。本文以最容易获得的二值发票图像作为系统输入,在分析对象识别内容及版面特点后,设计系统流程,确定各个处理环节的输入输出以及需要实现的功能。在结合票面特点基础上,本文提出一种基于切割矩形框的Hough变换算法用于检测倾斜角度,提高检测的可靠性并减少运算复杂度;定位环节,本文提出基于先验知识的粗定位和基于移动矩形框的细定位;块去噪环节,本文在对四种常用滤波算法进行比较的基础上选择效果最好的形态学降噪方法;字符切割中,基于机打数字的无粘连特点,采用基于投影的字符切割法;数字识别环节,基于发票版面上的数字字号大小不同的特点,提出一种基于结构特征和投影特征相结合的数字识别算法实现数字的准确识别,通过与BP神经网络算法的对比表明前种算法更适合于本系统。对整个系统识别率进行测试,实验214张发票,共包含8088个数字字符,其中7612个字符被准确识别,识别率达94.11%,基本达到系统设计目标。
其他文献
中小股东1权益的保护即是我国商法、经济法的关注焦点,又是一个全球性的立法难题。寻求合理有效的机制,是各国立法者努力的方向。即要突出公平的价值理念,又彰显自治与效率,
目的:溃疡性结肠炎(ulcerative colitis, UC)是一种累及直肠和结肠黏膜的慢性非特异性炎症性疾病,其病因和发病机制至今尚未完全明确,也无理想的根治方法。有证据表明多种细胞
城市化发展引起的土地利用方式和生态系统质量的变化逐渐引起人们的重视,人类的社会经济活动已经对生态系统的结构和功能造成了很大影响。如何依据生态学原理和系统科学方法,