【摘 要】
:
双目视觉作为计算机视觉的重要分支,因其部署成本较低、结构简单,在无人驾驶、虚拟现实和三维重建等多个领域得到广泛应用。目前,虽然基于卷积神经网络的双目视觉立体匹配模型可以得到良好的效果,但在实际部署时大都存在匹配精度、运算时间、硬件部署成本无法兼顾的问题。为此,提出了基于空洞卷积的双目视觉立体匹配方法以兼顾上述三个因素,并验证了其有效性。论文的内容主要包括:针对采用卷积神经网络实现双目视觉立体匹配方
论文部分内容阅读
双目视觉作为计算机视觉的重要分支,因其部署成本较低、结构简单,在无人驾驶、虚拟现实和三维重建等多个领域得到广泛应用。目前,虽然基于卷积神经网络的双目视觉立体匹配模型可以得到良好的效果,但在实际部署时大都存在匹配精度、运算时间、硬件部署成本无法兼顾的问题。为此,提出了基于空洞卷积的双目视觉立体匹配方法以兼顾上述三个因素,并验证了其有效性。论文的内容主要包括:针对采用卷积神经网络实现双目视觉立体匹配方法中普遍存在参数量大、GPU资源成本高的问题,提出多尺度聚合的立体匹配方法。首先构建基于空洞卷积的多尺度结合的特征提取网络,利用金字塔结构搭建网络基础架构,进一步探索空洞卷积模块设计对模型的影响,构建简化的特征提取模型;同时,采用迭代聚合策略,设计从低尺度到高尺度下视差聚合方法,进一步分析多个尺度聚合结果融合对模型的影响,采用多个代价卷交叉融合的方法获得更为准确的代价卷。针对现有模型在较低参数量的条件下匹配精度不高的问题,提出了组相关代价聚合的立体匹配算法。通过分析输入到聚合网络信息的丰富程度对结果的影响,构建基于多尺度信息融合策略的特征提取子网络,结合空洞卷积获得大型特征卷,并利用分组相关代价计算方法获取初始代价以减少信息损失;分析编码器解码器结构,构建双沙漏结构的相似度计算的聚合子网络;为获得最终代价卷,引入利用浅层特征卷积得到引导图并通过双边网格进行上采样的方法;最后围绕计算得到初始视差图中异常值与不连续区域,提出利用空洞卷积模块与注意力机制结合的修正方法。在此基础上,利用Scene Flow、KITTI2012/2015数据集对上述模型进行验证与评估。实验结果表明,基于多尺度聚合的立体匹配方法能够在仅2.1M的参数量下,以及低成本GPU资源下获得较好的匹配精度,其运算时间为0.1秒;基于组相关代价聚合方法能够在保持较少参数量的同时,D1-all指标降低至2.75%,运算时间仅为0.14秒,同时其匹配精度达到较高水平。因此,所提出的双目视觉立体匹配方法能够达到了精度、时间、硬件成本的协调。
其他文献
近年来,随着税收政策的不断改革、“营改增”“国地税合并”“减税降费”等税制完善大事件的发生,我国税务环境逐渐步入新常态,企业外部涉税情况也越来越复杂。在此宏观背景下,税务机关的执法监管力度逐渐加大,稽查人员的素质不断提高,因此导致上市公司、名人因偷漏税行为曝光而声名狼藉的丑闻层出不穷。而房地产行业作为我国支柱型产业之一,具有项目开发时间跨度长、涉税业务环节和税种多等行业特征。同时,许多房地产开发企
随着层出不穷的新技术应用、更加多样化和个性化的客户需求不断涌现,大规模定制逐渐成为一种汽车行业的必然趋势。要实现大规模定制的生产模式,加强产品数据管理尤为重要。作为汽车企业的数据管理和过程管理核心,产品数据管理是所有工程和制造活动的出发点,反映了企业的业务流程与管理规范。只有在先进的产品数据管理体系的支持下才能使大规模定制成为可能。本文以A汽车公司产品数据管理现状为基础,采用KJ法对A汽车公司面向
随着互联网的飞速发展,人们的生活方式也发生了巨大的改变,越来越多的人在互联网进行交流、购物等。其中,以亚马逊、淘宝、京东为代表的网络购物平台成为了人们的首选购物渠道。电商平台每天都会产生巨量的文本数据,用户会根据自己对购买产品的使用体验给出相应的购物评价。消费者对商品的评论表达了消费者对商品的情感态度,这对于其他消费者选购该商品时具有重要的参考价值,同时对于商家和网站管理者进行下一步的决策具有指导
本文以满文档案中收录的有关孔有德盛京家产人丁安置情况的档案为基本资料进行研究。翻译整理相关档案,确认孔有德在盛京留下的人口皆是孔有德原十五佐领下人,且并无罪责。因其多以种地为生,盛京佐领将其编入盛京内务府粮庄,称为“无罪拨入”,这些人的身份从旗下自由人转变为粮庄内奴仆。孔有德盛京留存人丁编为7个粮庄。每庄计入庄头各编15丁,补放7个庄头,庄头纳入管领。杨凤保等编庄后,不满被编入粮庄,强烈要求拨出官
近年来,物业管理公司因其专业性和高成长性备受资本市场的青睐。与此同时,国家亦在政策层面支持物业管理行业的发展,促使该行业的市场规模日益增长。因此,越来越多的物业管理公司成功通过上市融资跨入资本市场,这也导致目前物业管理行业的竞争越发激烈。通过并购进行规模化发展以寻求新的业务增长点,是目前物业管理公司保持竞争优势和抢占市场份额途径和有效方式。基于此,本学位论文以物业管理行业龙头公司之一的Y公司并购M
随着经济增速放缓、市场需求下滑以及产业结构调整等多重因素的影响,房地产开发企业纷纷向产业地产转型,寻求多元化发展,但产业地产多为持有型物业,比传统房地产开发周期和投资回报期更长,而融资模式仍以银行贷款等债权融资方式为主,资金退出机制不畅,整体行业发展受限,亟需寻求创新投融资模式。国家现大力推行公募REITs这种新型资产证券化融资模式,为房地产企业融资提供了新的思路。本文选取“博时招商蛇口产业园封闭
随着互联网迅速发展,线上消费已成为一种趋势,并为广大消费者所接受,因而各种购物平台的在线评论信息也开始呈现爆炸式增长。通过挖掘这些评论的潜在情感倾向,企业可以快速找准自己的定位,从而在用户体验的基础上改进产品和服务,获得消费者的信任和青睐,促进服务业的蓬勃发展。同时,也能促进在线评论者的交流,帮助用户更好更快的做出决策。因此探究在线评论信息,挖掘其背后的情感倾向具有重大的商业价值和学术价值。本文主
小样本细粒度(Few-shot Fine-grained,FSFG)图像分类,在实际生活中具有十分重要的现实意义。在生物研究、医疗影像和商品销售等领域具有很好的实用场景和应用潜力。细粒度图像的某些类别中标记良好的样本有限,同时其分类工作需要强大的专业认知能力。这给细粒度图像进行准确的分类带来巨大的挑战。本文基于深度卷积特征的FSFG图像识别研究,旨在有限的训练数据下对细粒度图像进行准确的分类。论文
在线社交网络是对实际世界对象及其间相互关联关系的抽象描述。在网络中的节点代表着实体对象,而连接则代表实体间的交互关联。这些链接中包含丰富的节点属性信息,结构信息以及网络演化信息。在网络的演化过程中,某些链接可能出现或消失,需要对缺失数据进行补全以及对未来可能出现或消失的链接做出预测。同时作为数据挖掘领域的一个重要分支,链路预测被应用于社交网络、电子商务、学等领域,具有很重要的现实意义。目前基于相似