【摘 要】
:
随着深度学习的不断发展和应用,目标检测效果有了明显的改善.但由于目标检测任务需要检测多尺度信息,而目前的检测器在不同尺度物体检测方面仍有不足,尤其是对小目标物体,易出现漏检以及误检的情况.本文针对场景中出现的小目标漏检及误检问题,对小目标检测进行研究,对YOLOv4网络进行改进,在YOLOv4网络上增加专门针对小目标物体的特征层,实现语义信息和定位信息更好的融合.同时,增加数据集中小目标物体的占比,来提高小目标物体的检测精度.实验结果表明,所进行的网络改进达到了提高目标检测效果的目的.
【机 构】
:
上海工程技术大学机械与汽车工程学院,上海201620;大工科技(上海)有限公司,上海200000
论文部分内容阅读
随着深度学习的不断发展和应用,目标检测效果有了明显的改善.但由于目标检测任务需要检测多尺度信息,而目前的检测器在不同尺度物体检测方面仍有不足,尤其是对小目标物体,易出现漏检以及误检的情况.本文针对场景中出现的小目标漏检及误检问题,对小目标检测进行研究,对YOLOv4网络进行改进,在YOLOv4网络上增加专门针对小目标物体的特征层,实现语义信息和定位信息更好的融合.同时,增加数据集中小目标物体的占比,来提高小目标物体的检测精度.实验结果表明,所进行的网络改进达到了提高目标检测效果的目的.
其他文献
产品服务系统配置,是产品与服务进行融合的新生产模式,其提供产品与服务结合的一体化解决方案,使产品更具市场竞争力.本文收集了 Web of Science核心数据库收录的2006年~2021年间产品服务系统配置研究的相关文献,从发文数量、关键词共现、发文机构等方面出发,绘制其相应知识图谱,分析产品服务系统的研究现状与前沿态势.研究发现,方案优化、智能制造、商业模式等是近年来产品服务系统配置研究中的高频关键词,基于大数据时代的智能制造是新兴的研究重心.
针对双向感应耦合电能传输(ICPT)系统的混杂特性及移相控制方法下系统启动、不同功率传输模式切换时电流波动大的问题,分析了双LCC型补偿拓扑双向ICPT系统的拓扑特性,给出了双向ICPT系统变换器运行的各工作模态.基于混杂自动机理论建立了双向ICPT系统的混杂自动机模型,推导了系统在不同工作模态下的状态空间方程,并根据系统连续状态量与各工作模态间的关系,确定了系统不同工作模态发生切换的边界条件.在此基础上,将双向ICPT系统的控制问题转化为系统离散状态模式边界条件的选择问题,设计了系统混杂控制策略.最后基
目前,随着汽车尾气排放污染日趋严重,汽油质量标准日益严格,中国大力发展以催化裂化为核心的重油轻质化工艺技术,对汽油进行精制处理,实现汽油清洁化.在实现汽油清洁化的过程中,会不可避免地降低辛烷值(RON),亦会同时出现较大损失值单位,无疑给企业增加了生产成本,减少了收益.为此,本文通过建立基于随机森林的汽油精制过程中RON损失预测模型,对RON及其指标进行预测.首先,命名建模变量并计算矩阵相关性,利用随机森林法对降低RON损失模型所涉及的158个变量进行二次降维,提取前30个主要变量;其次,基于随机森林法对
基于学校现有的监控设备,创造性地将OpenPose人体姿态捕捉技术和深度学习技术应用于校园暴力监控预警领域,能够实现对校园暴力的智能监控预警,为遭受校园暴力的学生提供线上心理支持和法律援助,同时能够通过识别面部表情分析学生的心理健康状况并提供心理疏导服务.系统可以很好地完成暴力识别,能够对校园暴力行为进行防治.
介绍了基于RP2040和机器学习开发的一款可以实现语音控制的语音识别设备,开发过程中将微控制器和机器学习进行结合.主要讲解了语音识别设备的语音控制模块开发过程中语音信号的处理、模型的搭建与训练等内容,其中语音信号主要采用傅里叶变换进行处理,模型的搭建过程中参考数据的处理与载有RP2040芯片的树莓派Pico的容量进行调整,完成语音信号的处理训练,最终预测正确率高达98%,较好地实现了语音控制的开发.
针对社区发现中,部分节点划分难的问题,探讨重叠社区检测的优化模型和求解的视觉进化神经网络.模型通过设计节点隶属度矩阵和节点分割规则,建立以模糊分割阈值为变量,且能评估社区划分效果的改进型模块度函数;算法设计中,以候选解构成的状态矩阵对应函数值矩阵作为输入,依据果蝇视觉系统的信息处理机制,建立以输出作为状态学习率的果蝇视觉前馈神经网络,进而借助灰狼优化的位置更新规则,设计状态更新策略,获得基于重叠社区检测的果蝇视觉进化神经网络及其算法.该神经网络的计算复杂度,由状态矩阵的大小及社区网络的节点数确定.比较性的
研究一种基于非接触式传感器的手势识别密码技术.以STM32F103单片机作为整个系统的控制核心,利用高性能传感器模块采集特定的手势数据,相互间采用IIC进行通信.采集的手势数据可以控制不同的器件,并且可以作为手势密码进行日常使用,识别的结果在LCD屏上显示.通过测试,该手势识别密码技术功耗较低、防误触率高、稳定性好、可以用作智能家居控制系统以及智能门禁系统.
基于虚拟仿真实验,设计了 4位数码管显示的4种不同方案,通过Proteus硬件电路设计和C程序仿真实验,以静态显示和动态显示的方式,实现了其功能.采用P0~P3 口直接驱动数码管,74LS373锁存器驱动数码管,PNP三极管输出端驱动数码管,74HC138译码器和反向缓冲器7406作为驱动数码管的器件.电路设计从易到难,软硬件紧密结合,给学习电子电路、单片机的学生以启示,帮助学生掌握相关的知识,并能迁移所学知识,对理实一体化教学起到很好的辅助作用.
利用新型记忆网络模型(Mode of Memory Network,MMN),挖掘知识点之间的关系,评估学生对知识点的掌握程度,使用键静态矩阵存储知识点基本数据、值动态矩阵存储和更新相应知识点的掌握程度,并评估学生不断变化的知识状态,具有实时性和客观性.为教师统筹教学资源、优化教学计划提供客观量化的依据.
图像语义分割技术是一项重要的图像后期处理方法,在计算机智能识别和视觉传达领域有着重要应用.从图像语义分割局部增强问题出发,研究两种常见的图像分割技术,在此基础上提出了改进的图像局部滤波去噪增强算法,并详细阐述了算法的实现步骤,用实验的方法通过比较了图像熵值大小分析算法的运用效果,结果表明,改进的图像局部滤波去噪增强算法的熵值最大,增强效果最好.