基于深度学习的建筑物识别

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:l420303622163com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市化的快速发展,城市与城市间的辨识度越来越弱,人们对千篇一律的城市建筑物已经感到视觉疲劳。那些富含历史文化底蕴的建筑物成为了各个城市争相效仿的目标,各个城市开始修建一些别样特色的建筑物,这些建筑物不仅是城市的地标,也是城市历史文化的传承,也是城市导向的坐标,更是吸引游客的有效手段。而繁杂的特色建筑物对人们的识别也带来了较大的影响,近年来深度学习的方法在图像识别领域取得了巨大的成功,它具有强大的学习能力和高效的特征表达能力,更重要的优点是从像素级的原始数据到抽象的语义概念逐层提取信息,这使得它在提取图像的全局特征方面具有突出的优势,相较于传统的模式识别有更高的识别效率。本文基于深度学习的方法,研究、设计并实现一套建筑物的识别方法,让人们找到这些感兴趣的“网红建筑物”的所在之处,为这些城市带来潜在的旅游价值。本文针对建筑物的各种拍摄环境,制作了专用的地标建筑物数据集。数据集中包含了不同天气、不同光照、不同角度的样本,有效提升模型的抗拟合性。本文使用Faster R-CNN算法作为基础训练模型,针对建筑物识别的特殊场景(建筑物被遮挡、夜间情形等情况),对原有的基础网络进行改进,采用一种稠密连接的残差块网络DRNet。这种网络可以利用之前的特征框图与本层输出结果在通道维数上进行叠加,达到特征重复利用的效果。最终生成的特征框图不但没有失去低层的边缘纹理信息,而且通过在深层的卷积网络复用低层特征框图,使得融合后的特征框图具有更加丰富的特征信息,有效提高了模型对复杂环境下拍摄的照片的识别率。由于采集的数据集图像尺度不一,而原模型在RoI Pooling层提取特征框图时使用了两次整数量化,使得实际的候选框与得到的候选框有一定的差异,特征框图有一定程度的形变,对图像的空间信息有所损失,降低了特征框图的准确度。因此本文使用了RoI Align层提取特征框图,通过双线性插值的方法保留特征框图的浮点数,解决了原算法中区域不匹配的问题实验结果表明,在训练数据集充足的条件下,使用本文方法对地标建筑物能达到82.1%的mAP,对建筑物坐标的预测也较为精准。通过与其他模型比较分析,本文模型不仅对正常图像具有较好的识别效果,而且对复杂环境下拍摄的图像的识别也有优秀的表现。
其他文献
为弄清略阳乌鸡黑素皮质素受体1(MC1R)基因的遗传变异与黑色素形成的关系,采用PCR-SSCP测序方法,对略阳乌鸡蛋白质理化性质和分子结构进行了研究。结果表明:略阳鸡种内MC1R变异
目的:通过监测慢性髓系白血病慢性期(CML-CP)患者尼洛替尼(NIL)血清谷浓度水平,探讨其与临床疗效及不良反应的关系。方法:根据患者服用NIL剂量将其分为A组(44例),600-800 mg/
2013年11月22日,国金证券发布公告,将与腾讯展开战略合作。这则消息立刻成为行业热点,并引领了一波以国金证券、太平洋、锦龙股份为代表的以民营中小券商触网为逻辑的行情。这几
报纸
苏醒灵4号对速眠新麻醉犬的催醒作用梁德勇,阎章年,吴永奎(长春农牧大学军事兽医研究所长春,130062)1前言苏醒灵4号是我所最新研制的动物麻醉拮抗剂,对眠乃宁、二甲苯胺噻唑都有理想的拮抗作
2006年6~10月对青藏高原纳木错流域你亚曲、曲嘎切、昂曲3条河流进行了连续采样,同时在2005年9月和2006年9月2次环纳木错考察中采集了其他河水的样品.河水中主要阴离子(Ca2+
焊接过程中铝合金易产生较大的残余应力和变形,薄板铝合金的焊接变形更为突出。本文通过数值模拟与试验的手段,开展了铝合金的随焊激冷、动态辅助加热以及热-冷源联用工艺的
对宽带多媒体卫星通信系统的需求进行分析的基础上,对基于星载ATM交换的Ka波段宽带多媒体卫星通信系统的技术特点、系统组成、协议栈结构及工作模式进行简要介绍。
元音是英语语音的核心构成,其发音直接影响语音的产出质量。采用实验语音学的方法,用语音分析软件Praat评估视障大学生及明眼大学生对照组的英语前元音产出能力,了解视障大学
目的总结先天性膈疝的围手术期处理经验,以提高先天性膈疝患儿的抢救成功率和生存质量。方法回顾性对比研究四川大学华西医院1998年1月至2005年4月23例新生儿先天性膈疝患儿
炼油常减压生产的轻油中含有的盐类,会影响轻质油品的质量,造成设备腐蚀,对油品的储存、运输及加工过程造成极大的危害。在轻质油品中添加洗盐水并采用脱水型水力旋流器进行