论文部分内容阅读
建筑图集是技术人员为避免重复性劳动而设计、试验或在实践中操作出来的常规通用做法,是工程建设标准化的重要组成部分。设计师在设计工程图纸时若需使用建筑图集上的内容,只需在图纸上标注图集编号,从而简化图纸表达。当建筑工程人员在施工现场需要参考建筑图集时或查找翻阅纸质版或搜索查找电子版,既不方便工作效率也不高。随着移动互联网技术的不断发展,使用智能化方法让建筑工程人员查询图集方便高效,受到了广泛关注,移动端的建筑图集编号的智能识别与图集检索具有极高的研究价值和应用前景。本文所研究的系统是将OCR识别技术应用到建筑领域的一个开发项目,识别的目标是建筑图纸上的图集编号。因为建筑图纸多为蓝图,字体也为蓝色,前景信息和背景信息不易区分,图纸经过建筑施工者长时间的使用还会出现破损、褪色等情况,再加之图集编号的特殊编码规则,存在圆形、分割线,上下数字编码以及图集编号被施工图周围的其它图形和数字干扰等问题,使得OCR技术无法直接运用,也给图集编号的定位和识别带来了极大的挑战。本文针对上述问题,并结合工程专业人员实际工作需要,提出了一种基于深度学习和图像预处理的OCR识别技术,把OCR技术的运用推广到一个新的领域。本文的主要工作包括以下几个方面:(1)系统架构设计。通过对用户需求、对图纸中图集编号周围存在大量随机字符和结构,传统定位会产生大量冗余信息、图集编号中的圆形特征造成识别不准确等问题进行深入研究分析,对系统进行设计。将系统的功能主要划分为六大模块其中包括用户登录注册、图像采集、图集编号检测、图集编号分割、图集编号识别、建筑图集检索。(2)系统实现的算法选取与技术采用。对图集编号检测,识别以及图集检索等关键模块中的流行算法做了充分的实验比较,最后选取了端到端的目标检测算法YOLOv3,提出了基于最大轮廓的圆的定位切割算法,采用了百度OCR文字识别技术并运用了阿里云0SS作为存储服务。(3)系统功能实现。系统实现采用客户端/服务器结构,将任务合理分配到Client端和Server端,其中客户端使用Android前端开发技术,服务端使用Python编写的Flask微型框架进行开发,实现了系统所有模块功能,实验测试表明整个系统达到了工程运用的预期效果。系统的运用为工程人员查询图集提供了方便,大大的提高了工作效率。也可以将本文所研究的内容应用到AR眼镜等智能设备中,做到真正的解放双手。因此该系统在建筑领域中具有很好的应用价值和发展前景。