论文部分内容阅读
随着信息化社会的快速发展,民众在提升自身素质的同时对知识的渴求也与日俱增,图书馆便成为人们寻求知识的优先选择。图书馆中书籍数量及阅览人流量的增加,图书馆普遍采用开架阅览方式前提下,使用后书籍错序摆放是常见现象。将错序图书进行重新摆放成为图书馆日常必须面对的难题。传统的图书整理靠人工完成,耗时、浪费人力、易出错的缺点显而易见。随着机器视觉技术的发展和应用普及,智能技术的广泛应用及软硬件性能的不断提升,使基于机器视觉的错序图书自动识别和整理成为可能,本文研究目的是设计并实现基于机器视觉智能图书识别检测系统,以提高错序图书整理的自动化程度。本文围绕机器视觉在错序图书识别中的关键问题展开研究,针对图书边缘为直线的先验条件,采用边缘算子结合直线检测算法对图书图像进行书脊提取,基于Faster-RCNN的目标检测算法,对索书号区域进行定位提取,以达到提高索书号提取准确率的目的。并对提取得到的索书号区域中的字符分割技术进行研究,为了提高系统对字符分割的准确率,采用基于连通域分割算法对索书号进行分割。再将分割后的字符进行基于卷积神经网络的字符识别操作,识别出的索书号信息与系统数据库中预存图书顺序信息进行交互,将检测结果进行反馈。基于上述技术,本文使用C++语言、Caffe深度学习框架并结合数据库技术完成了一个图书错序检测系统的设计。系统分为三个基础功能模块,预处理模块、识别模块、后处理模块。系统初步测试表明,本文提出的总体方案和开发系统可用于检测通用索书号样式的图书基本信息与图书顺序信息,为图书馆自动化整理提供一种可行的方案。