【摘 要】
:
单目图像深度估计是根据RGB图像估计每个像素点的深度值,即物体离摄像头的距离。它作为计算机视觉领域的热门研究方向之一,已广泛的应用到自动分拣机器人、VR虚拟现实、自动驾驶等人工智能领域。目前,在基于深度学习的单目图像深度估计方法中,存在特征提取、表达不够充分的问题,导致深度估计精度不高。本文围绕特征提取、表达展开研究,旨在提高深度估计精度,主要工作如下:1.设计了基于多尺度特征提取和结构相似性的单
论文部分内容阅读
单目图像深度估计是根据RGB图像估计每个像素点的深度值,即物体离摄像头的距离。它作为计算机视觉领域的热门研究方向之一,已广泛的应用到自动分拣机器人、VR虚拟现实、自动驾驶等人工智能领域。目前,在基于深度学习的单目图像深度估计方法中,存在特征提取、表达不够充分的问题,导致深度估计精度不高。本文围绕特征提取、表达展开研究,旨在提高深度估计精度,主要工作如下:1.设计了基于多尺度特征提取和结构相似性的单目图像深度估计方法模型。该方法引入Res2Net网络作为特征提取器,Res2Net在单个残差块中对输入特征图进行通道分组,对分组后的特征图采用阶梯型卷积提取更细粒度的多尺度特征,提高了网络多尺度特征提取能力,最终提升了深度图的整体精度。其次,设计了边缘增强模块,使用高通滤波器保留了物体的边缘特征,解决了原网络下采样过程中边缘像素丢失问题,提高深度图质量。最后,在损失函数中引入了结构相似性,通过计算图像块的损失值,加强了网络学习局部特征的能力,提高深度估计的精度。实验结果表明,该方法可以有效提高深度估计精度,均方根误差RMSE达到了0.508,相比于基础网络减小了2.2%,阈值δ<1.25达到了0.875,相比于基础网络提升了0.9%。2.设计了基于有效特征提取和小波损失的单目图像深度估计方法模型。该方法首先设计了一种上采样模块,该模块分为两部分,一部分采用亚像素卷积生成高密度有效像素的特征图,避免了原网络中产生大量的冗余像素的问题;另一部分采用不同大小卷积核对亚像素卷积后的特征图进行特征提取,提高网络对有效特征的提取、表达能力。其次,在损失函数中引入了小波变换,将图像划分为高频区域和低频区域,通过对不同区域计算损失函数监督网络训练,提高了网络表达特征的能力。实验结果表明,该方法可以实现深度图整体精度的提升,均方根误差RMSE达到了0.509,相比于基础网络减小了2.1%,阈值δ<1.25达到了0.875,相比于基础网络提升了0.9%3.设计了基于多尺度有效特征提取和小波损失的单目图像深度估计方法模型。该方法综合了Res2Net网络、边缘增强模块、上采样模块、小波损失函数的优点,提高网络的多尺度特征、有效特征的提取和表达能力。实验结果表明,该方法提高了深度图的整体精度,均方根误差RMSE达到了0.506,相比于基础网络减小了2.4%,阈值δ<1.25达到了0.876,相比于基础网络提升了1%。
其他文献
小麦作为人们日常生活中息息相关的农作物,其生产、加工、运输等环节的食品安全问题是直接关系到消费者的头等大事。小麦籽粒在生长及收获储存加工等过程中可能受各种产毒真菌的污染,真菌毒素的污染是影响小麦农作物质量安全的重要因素。以食品监管部门对小麦中多种真菌毒素的大量抽检数据为对象,本文应用数据挖掘方法研究了小麦质量安全预警模型。主要完成的工作有:1、给出了一种基于机器学习的小麦真菌毒素预警方法。该方法主
SHA256(Secure Hash Algorithm 256)作为目前最可靠的杂凑算法之一,在信息安全等领域具有重要的应用价值。在区块链技术中,默克尔树的构造、区块之间的链接和共识机制的运作,都以SHA256算法作为保障其系统安全性的基础支撑。目前已有研究基于HOL4交互式定理证明器验证区块链共识机制的数据一致性,该过程将SHA256算法假设为理想化模型,这导致了研究结果不可靠。为了提高验证结
教研是基础教育阶段教师专业发展的有效方式。本文基于北京市海淀区青龙桥学区英语教师教研实践,阐述了CFG模式引入区域教研的实践策略与思考,以期为教师专业发展寻找新路径。
乙烯是化学领域生产的重要原料之一,可以用来合成纤维、橡胶、塑料等基础化工原料。乙烯裂解炉是乙烯生产装置的主要设备,主要是将天然气、炼厂气、原油和石脑油等原料转化为裂解气,最终加工成乙烯、丙烯和各种副产品,其结构包括双辐射室、单辐射室和毫秒炉。乙烯裂解炉的生产能力和技术决定着整个乙烯装置的生产规模、产量和产品品质,乙烯裂解炉装置的操作优化具有重要意义。鉴于乙烯裂解炉过程的复杂性,本文从分析过程的内部
随着信息时代的发展,各类信息呈指数型增长,数字化学术出版物的数量也愈发庞大。面对海量文献,科研人员在撰写论文选择参考文献时往往面临着信息过载问题。引文推荐方法的出现与发展成为了解决这类现象的有效方法之一,但传统的引文推荐方法大多是仅考虑论文文本内容的基于内容的推荐方法,存在挖掘论文信息不够全面,属性利用单一的问题。知识图谱作为蕴含大量语义与结构信息的图网络结构,可以有效补充各类信息,近年来受到大量
数智化的时代背景下,数据驱动建模的研究与应用如日方升。但由于数据采集成本高、数据重复、波动小等原因,使得具有代表性的、可用于研究与应用的样本不足问题时有发生。并且,训练数据不足、数据质量差常使数据驱动模型的泛化、预测能力不足。因此,样本不足成为了数据驱动建模中迫待解决的问题。虚拟样本生成方法是解决样本不足问题的有效手段,有着极为重要的研究意义与实用价值。本文提出了一种基于CGAN的逆向虚拟样本生成
作为一种智能化教学平台,面向编程学习的线上自动评分系统(Online Judge,OJ)逐步在高等学校中推广使用,一方面可以让学生完成线上编程并及时获得分数反馈,另一方面帮助教师及时了解学生编程能力情况进而改进教学方法。基于动态测试的程序自动评分方法是当前应用最广泛的一种方法。该方法根据被测程序通过测试用例的数目自动计算分数,但如果程序算法逻辑基本正确,因某个细节错误造成所有测试用例失败,程序依旧
近年来,MEMS加速度计因其体积小、重量轻、功耗低、可靠性强等优点被广泛应用于我们的日常生活中,但是MEMS加速度计一直存在着输出数据精度较低的缺点,因此,提高MEMS加速度计的精度具有非常重要的现实意义。本文针对MEMS加速度计量测精度较低的问题,设计并搭建了一整套标定系统,并着重研究解决了MEMS加速度计的确定性误差和随机性误差。完成的工作内容主要如下:(1)针对MEMS加速度计标定系统进行总
石化行业为经济建设和人民生活提供了强有力的保障,而乙烯作为典型石化产品,生产装置运行过程复杂、能源消耗量大。通过对其建立预测模型,寻找生产配置和能效优化的方向,是落实节能减排的有效途径。本文针对麻雀搜索算法易陷于局部最优的缺点,提出改进麻雀搜索算法,并将其应用于解决极限学习机输入权重和隐层阈值随机生成导致的泛化性能差的问题,提出了基于改进麻雀搜索算法的极限学习机,建立了乙烯装置生产能力预测模型,能
当今世界,由于环境污染、能源匮乏、温室气体的大量释放,人们需要更多的洁净能源。燃料电池由于具有高能量密度和低排放的特点而受到了广泛的重视。但是,由于燃料电池中的氧还原反应动力学很缓慢,需要许多铂基催化剂来驱动化学反应。高昂的铂金价格和稀缺的储量限制了燃料电池的应用。所以,人们目前还需要研发廉价高效的非贵金属催化剂来催化氧还原反应,如过渡金属氧化物等。此外,利用电催化二氧化碳还原技术将二氧化碳转化为