基于特征融合与自适应锚框的Faster R-CNN算法研究

来源 :安徽建筑大学 | 被引量 : 0次 | 上传用户:ahjon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以大数据和人工智能技术为依托,计算机视觉获得广泛关注和大量研究,目标检测作为该领域的一项基本任务,在智能安防、无人驾驶和机器人等诸多领域都得到大量应用。得益于机器学习、深度学习技术的进步,国内外研究学者提出了许多优秀的检测算法,但受制于真实环境中目标之间的尺度差异、复杂的背景等因素,现有的通用检测算法仍具有改进和优化的空间。本文基于经典二阶段Faster R-CNN检测算法,围绕网络结构和检测流程中对精度影响较大的特征利用和表征、候选区域的提取及训练策略等问题进行系统的理论分析、模型的改进、实验过程的设计及结果验证和分析,具体工作如下:(1)针对Faster R-CNN算法在有遮挡或检测场景复杂条件下,对不同尺度目标的判别能力差,检测精度低的情况,提出一种多尺度特征融合算法。首先针对FPN单向特征融合存在的信息不一致问题,增加一支自底向上的PA-Net路径结构,提高目标对空间细节特征的利用,并通过尺度变换完成不同层级的融合过程,然后引入一种简单可行的注意力策略改善目标的特征表达能力,利用高斯函数非局部注意力模块增强特征的表征能力,最后设计网络结构验证该算法的有效性。(2)针对Faster R-CNN算法中的区域提议网络在训练过程中需要人为定义不同尺寸和纵横比的锚框,并基于滑动窗口依次遍历整幅图片,对于其中各种尺度目标进行预测时存在不确定性和位置不够准确性的情形,提供了一种锚框可以自适应生成的算法,生成锚框的流程被具体定义为位置预测和形状预测二条分支,然后添加特征自适应模块,其目的是使卷积特征自适应去匹配锚框的形状,最后通过设计模型验证此方法能为输入图像生成数量更少但质量更高的锚框。(3)对于特征融合与自适应锚框生成器分别位于Faster R-CNN算法的不同阶段,在上文已知的情况下,提出基于特征融合和自适应锚框相结合的Faster RCNN算法,将优化目标特征利用和增强表征后的多尺度卷积特征输入改进的区域提议网络,让模型为每张图像预测更有针对性和合适的锚框,进而提取更加准确的候选框。(4)本文使用VOC和COCO两个经典目标检测数据集进行实验分析,消融实验均以Res Net50+FPN作为基线展开,通过对VOC数据集中的20个目标对象进行具体的分析说明,从不同角度证明所提每个模块的有效性,同时将本文方法与其他经典检测算法对比,并可视化检测结果。图[39]表[13]参[90]
其他文献
工作于电感电流临界连续模式(Critical conduction mode,CRM)的Boost功率因数校正(Power factor correction,PFC)变换器的升压二极管无反向恢复过程、开关管零电流开通,被广泛应用于中小功率的有源功率因数校正技术场合。传统定导通时间(Constant ontime,COT)控制下,变换器理论上可达到单位功率因数,但是开关管的开关频率变化范围大。变导
学位
高等教育在社会发展中发挥着关键作用,是区域前进的重要依靠和动力源泉。过去统计学学者在对高等教育发展水平进行统计分析时,多倾向于采用传统的统计模型或选取少量指标探究其区域差异,而将综合评价这种经典统计模型与空间统计方法相结合的研究不多。在此背景下,本文基于2009-2018年中国30个省域(不包括海南)高等教育的面板数据,首先建立了更为完善的高等教育综合评价指标体系,并选用熵权-TOPSIS模型对中
学位
近年来,统计学方法已经渗透到各个领域,与计算数学等学科的交叉应用愈加广泛。受到不确定变量的影响,交通流和石油勘探等涉及不确定性的随机守恒律的数值模拟受到广泛关注。为了设计数值模拟方法求解随机守恒律,本文以流通量间断的随机守恒律的简化模型为研究对象,构建随机守恒律简化模型的数值模拟方法,采用最小二乘和非线性回归方法对误差数据进行回归分析,根据回归方程和预测值图形,验证已构造的数值模拟方法的计算效果。
学位
随着高性能计算机技术的发展和深度学习理论的进步,近年来神经网络的深度不断加深。为了降低深度网络模型对内存占用和计算效率的要求,方便部署于各种边缘侧设备,本文针对深度神经网络存在的参数量大和计算量大的问题,进行模型压缩方法研究和算法实现。设计了剪枝+量化的模型压缩方案,在可接受的精度损失情况下,减小了模型的尺寸并降低了计算量,最后将该方案的压缩结果移植到边缘计算设备上,在实际部署设备上验证了本文方法
学位
平面近场声全息只能识别阵列前方的声源,无法识别阵列后方的声源,球面近场声全息则可以识别任意方位的声源,实现三维声场的重建。等效源法是一种高效且极受欢迎的近场声全息计算分析方法,由等效源法与球形阵列结合形成的球面阵等效源法能有效实现声场重建和声源识别。但该方法也存在不足之处,例如声源频率适用范围窄、重建精度较低等。本文尝试将压缩感知算法与球面阵等效源法相结合,并采用空心球形传声器阵列作为测量前端,开
学位
城市轨道交通以其安全、平稳和高效的运行特点在国内得到迅速发展。但是,其日益增长的能耗问题亟待解决。本文从单区间牵引节能角度出发,提出了列车速度曲线优化方法;从全线运行节能角度出发,综合考虑列车牵引能耗、乘客乘车时间、乘客换乘和列车全周转运行时间等因素,提出了速度曲线和区间运行时间综合节能优化方法,主要研究内容如下:(1)研究列车自动运行系统,分析列车驾驶策略,明确列车运行过程中的性能指标;分析列车
学位
交通拥堵造成道路通行效率低下,严重制约了社会经济的发展。现代交通流理论的研究目标是建立能描述实际交通一般特性的交通流模型,寻找交通流的基本规律,以揭示交通拥堵产生的机理。由于三相交通流理论能够解释各种实际复杂的交通现象,因此该理论成为现代交通流理论研究的热点。元胞自动机模型具有良好的并行性、演化规则灵活以及计算效率高等优点,因此,本文在三相交通流理论框架下建立了双巡航控制极限元胞自动机模型。本文的
学位
区块链已应用于金融、医疗、教育等领域,其公开性的特点致使存在泄露隐私的风险。论文研究公有链和联盟链的区块链隐私保护问题。主要工作包括:(1)针对公有链系统存在难以找到用于分发密钥的单独可信KGC,以及签名易被恶意KGC伪造等问题,提出一种“基于SM9算法的多KGC环签名方案”。它通过正确性验证,且签名具有无条件匿名性。由于采用多KGC共同维护系统参数策略,多KGC之间相互限制,任何单独KGC均无法
学位
新能源的发展是解决能源与环境问题的关键。其中,太阳能凭借其分布广、可再生、无污染等特点广泛应用于新能源发电系统中。在光伏微电网中,以模块化多电平逆变器作为功率变换器,将光伏与储能装置结合起来,可以解决光伏发电的随机性和波动性,平滑功率输出,提高电能质量。因此,本文提出了基于模块化多电平光储混合并网逆变器的新型拓扑结构和功率分配方法。本文分析了模块化多电平光储混合系统的电路拓扑结构,分析了光伏电池和
学位
近年来,电力电子技术得到了快速的发展,大量电力电子设备接入电网,导致电网中的谐波污染日趋严重。谐波问题逐渐上升为主要的电能质量问题。谐波使发电设备、供电设备和用电设备工作在非安全状态,对通信系统也产生较大干扰,也影响到精密仪器的正常工作。检测电网中的谐波,制定合理有效的治理方法,是保证电网安全正常运行的重要举措。卡尔曼滤波算法及其派生算法具有过程简单、对噪声鲁棒性较强的优点,在谐波检测方面得到了广
学位