【摘 要】
:
以卷积神经网络为基础的目标检测模型,凭借着其卓越的性能优势,在交通、安防、医疗等领域展现出了极大的潜力和价值,而在未来检测模型的意义还要进一步加深。近些年来对于目标检测模型的研究也在飞速发展,不断有新模型、新结构出现,表现出更好的检测效果。本文聚焦于一阶目标检测模型SSD(Single Shot Multi Box Detector)在检测精度上的不足问题以及小型轻量化模型的设计问题,分别提出了设
论文部分内容阅读
以卷积神经网络为基础的目标检测模型,凭借着其卓越的性能优势,在交通、安防、医疗等领域展现出了极大的潜力和价值,而在未来检测模型的意义还要进一步加深。近些年来对于目标检测模型的研究也在飞速发展,不断有新模型、新结构出现,表现出更好的检测效果。本文聚焦于一阶目标检测模型SSD(Single Shot Multi Box Detector)在检测精度上的不足问题以及小型轻量化模型的设计问题,分别提出了设计方案。本文的研究工作及创新点主要在以下两个方面:(1)对SSD的改进。SSD作为经典的检测模型,现如今其精度不高,但是其检测思想和结构依旧经典。本文提出了SSD的改进版本MSSD(Modified SSD),在MSSD v1中提出了改进的深度可分离卷积模块,用作额外层的置换,为了进一步提高输出特征的利用率,设计了一种紧邻层的特征融合方法实现特征的重复利用,MSSD v1在VOC2007测试集上的精度提升了1.9%。MSSD v2的设计是从骨干网络、特征提取结构两个方面出发,首先采用了一种类VGG(Visual Geometry Group)的卷积神经网络Rep VGG作为骨干网络,对原有的VGG-16置换,以此获得更好的基础特征表达;之后分析了膨胀卷积、注意力机制的优势后,设计出了一种两分支特征提取模块,将两者的优势结合在了一起,同时利用注意力机制设计了特征融合模块进行特征的重复利用。将特征提取模块和融合模块嵌入到RepVGG中,得出了新模型MSSD v2,在VOC2007测试集上其精度要高于SSD4.48%,整体精度有较大的提升。(2)一种轻量化模型的设计。在分析了Shuffle Net v2的结构后,以其内部结构为基础提出了一种轻量和有效的目标检测模型Res-Shuffle。Res-Shuffle的骨干网络是由Shuffle Net v2的基本结构改进而成,达到适应目标检测任务的需求,同时引入了恒等映射和膨胀卷积的思想,沿用了SSD的检测流程。此外Res-Shuffle采用了一种自适应的正负样本选择方法,该方法的引入有两点优势,一是新模型不需要再设置众多的锚框,减少了不必要的工作量;二是样本的选择依据更有可靠性,样本的质量也有一定的保证。为了检测Res-Shuffle的性能,同时解决遥感飞机目标检测的任务需求,本文从多个数据集中搜集整理了一个专用遥感飞机图像集合。实验结果表明,Res-Shuffle以较低的参数量取得了更高的精度和速度,和其它轻量型网络构成的目标检测模型相比在性能上有着较大的进步。
其他文献
在农业生产领域,玉米是我国重要的农作物,玉米苗期的除草能有效保障作物产量。目前国内的除草方式主要包括人工除草、化学除草和中耕除草等,这些传统的方法存在各自的缺点,比如除草效率低、劳动成本高、破坏土壤环境和造成化学污染等,因此,研究智能农业除草机器人的技术具有现实意义。视觉系统是智能除草机器人的一项基础且重要的研究任务,高精度和低延时的图像算法是完成识别的关键,现有的除草机器人视觉系统普遍使用传统图
在《中国制造2025》以及《“十四五”规划和2035年远景目标纲要》的政策背景下,加快我国传统制造业产业升级、深入实施制造强国战略、加快发展现代产业体系,目的是推动我国高新科技的发展。机械手在我国工业生产领域有着广泛应用,但是大多数机械手只适用于当下的工作场合,不能做到多种不同条件下的夹持。为此,进行机械手的夹持特性研究是十分重要的,为后期机器触觉的感知研究提供一定参考价值。柔性两爪机械手的接触状
有轨矿车作为矿业开采过程中的主要运输设备,承担着矿物和人员的运输任务。随着社会对矿物资源需求的增大,矿物开采量也不断增加,矿井环境恶劣,给矿车操作人员的身体带来了极大的危害,长时间的驾驶导致操作人员疲劳和精力不集中等问题增大了撞车的风险。本文结合目前先进的自动控制技术和环境感知技术设计了坑道环境下有轨矿车自动控制系统,来提高有轨矿车自动化程度以代替人工操作实现坑道环境下的矿物运输。本文基于西门子P
节约资源,优化资源利用率一直是可持续发展的重要内容之一,是绿色智能制造的重要组成部分。优化下料问题是指将小的零件在大的原材料上进行合理的几何组合,切割下料,确定下料排样方案,以使得材料利用率最高。因此,对优化下料问题的研究是一个具有重要经济意义和社会效益的问题。优化下料问题本身具有较高时间和空间复杂度,属非确定型多项式问题,又称NP难问题,一般情况下不存在多项式算法。近年来许多专家学者在从事与此相
国内某冶金公司电解分厂电解槽车间,其生产采用电解精炼的方式将火法精炼产出的阳极铜进一步提纯,并回收有价金属。生产过程中均采用人工手动操作桥式起重机完成极板的吊运工作,同时驾驶员需要与地面指挥人员对话来完成极板与目标电解槽间的准确对接,占用人力资源较多,为了实现对电解车间的远程监管、减员增效,同时实现本地桥式起重机自动定位控制以及监控中心对车间工况的远程监控等自动化功能,本文对该电解分厂电解槽车间的
工业机器人是一种高柔性的自动化设备,是智能制造系统的重要组成。虽然工业机器人拥有较高的重复精度,但是其定位精度较低,在一些需要高定位精度的领域仍然无法应用,标定技术可以提高机器人定位精度而无需改变其本身结构。针对现有标定技术中使用的测量设备价格昂贵,标定流程繁琐的问题,本文提出一种基于拉线传感器的运动学标定系统,该系统可用于快速标定机器人运动学参数误差、传动参数误差,并补偿到机器人名义运动学模型中
双目视觉避障技术是在结合双目视觉技术的基础上对环境中的障碍物进行检测,获取其位置信息,并根据得到的信息进行避障的技术,具有信息采集速度快、感知环境信息丰富、成本低等优点,该技术的研究成果可广泛应用于移动机器人、无人机等领域。在该技术中,如何从背景中准确检测出前景(障碍物)是研究难点之一。障碍物检测过程中,受地面影响,生成的视差图中会存在小区域噪声,而基于一般的图像二值化处理很难做到完全去除这些噪声
随着我国工业机器人产量不断提高,很多的人工作业逐渐被工业机器人替代。在蓄电池生产中往往会存在大量重复性高的码垛工作,人工码垛蓄电池在效率上已经不能满足现代生产需求,这些都为机器人码垛技术的发展提供了机会。由于不同厂家生产的铅酸蓄电池电池外观、尺寸并不相同,并且码垛时抓取数量不唯一,而且现阶段市面上的码垛设备功能较为单一,只能实现码垛过程的单一功能,没有适用于多种规格蓄电池的通用码垛设备销售。本文以
在教育领域,问答题题型广泛用于各种考试中。以往针对问答题的自动评分研究吸引了大量学者研究,且大都面向电子版文档。而目前的作业、试题大都以纸质文档为主,故距实际应用较远。如何将问答题自动评分的方式方法应用到纸质对象的评阅中,还尚未有完整的解决方案,成为了自然语言处理在教育行业应用的重点和难点问题。在上述背景下,本文从教师的试卷批改工作入手,观察和调查教师的批改动作,根据改卷过程中的需求和计算机工作特
水资源是一种与人类生活和经济生产密切相关的重要因素,但地球上可供人类使用的淡水资源的数量并不多,不能满足人口数量增长和经济发展带来的用水量需求,加剧了水资源分配方面的矛盾。中国作为一个农业大国,每年农业上的用水比例一直占据着全国水资源消耗总量的榜首,2019年达到了61.2%。与此同时,农业灌溉中缺乏对水资源的高效利用,利用率仅有30%左右。因此,我国将大力推进节水灌溉作为现代农业的一项基本国策。