【摘 要】
:
行人检测是计算机视觉中的经典问题,历来是计算机视觉领域的研究热点,由于其检测目标的特殊性、广泛的应用前景及商业价值,已成为国内外学者及相关从业者竞相研究的对象。近年来,随着深度学习的迅猛发展,计算机视觉技术结合深度学习方法的行人检测算法,逐渐成为行人检测领域的主流算法。特别是基于卷积神经网络的深度学习算法提出以来,行人检测算法取得了突破性发展,已经具有很高的检测精度和速度,使行人检测效率达到了新的
论文部分内容阅读
行人检测是计算机视觉中的经典问题,历来是计算机视觉领域的研究热点,由于其检测目标的特殊性、广泛的应用前景及商业价值,已成为国内外学者及相关从业者竞相研究的对象。近年来,随着深度学习的迅猛发展,计算机视觉技术结合深度学习方法的行人检测算法,逐渐成为行人检测领域的主流算法。特别是基于卷积神经网络的深度学习算法提出以来,行人检测算法取得了突破性发展,已经具有很高的检测精度和速度,使行人检测效率达到了新的水平。然而综合文献分析,目前基于深度学习的行人检测遇到的主要挑战,也是检测算法的精度、速度与实际需求之间的差距,其检测精度和检测速度仍需进一步提高。其中,行人检测精度和速度的权衡是最具挑战性的问题,而多个行人多尺度问题是重要影响因素之一。在行人检测算法设计中,多人多尺度问题的解决能够提高行人检测的精度,所以对于行人检测多尺度问题的研究有现实意义。因此,面对此类问题,在充分调查研究并仔细分析当下代表性检测算法基础上,提出了一种基于多尺度特征融合的卷积神经网络行人检测算法。本算法为了充分利用行人图像的多种特征去实现行人检测,通过融合图像的颜色、纹理等特征,使最后得到的特征图具有的信息更加丰富,从而有效减少误检数量,提高检测精度。除此之外,在不同的位置提取不同尺度的特征图分别进行预测,最后合并预测结果。相较于只在网络的最后位置进行预测,能够有效减少丢失率,提高检测精度。主要研究工作包括以下三个方面。(1)设计行人检测网络结构。根据复现算法所获得的经验,借鉴经典的目标分类网络结构,并对其进行微调来作为基础特征提取网络。另外,提出一种多尺度特征融合方式,使用上采样放大特征图对特征进行融合,对行人的多方面信息进行充分提取,包括颜色、纹理信息以及梯度信息等。使学习到的特征信息更加丰富,弥补了单特征提取的特征信息不全面、对行人特征不能详细描述的不足,从而提高检测结果的精度。(2)提出一种适合行人特征的锚框设置方式。由于行人具有非刚性形变的特点,并且在拍摄的图像中行人姿态多样,拍摄时的角度也各有不同,导致图像或者视频中行人尺度大小不一,所以设置了不同尺度以及不同宽高比的锚框来对图像中的行人进行预测,使得最终的检测框更加精确。(3)对设计好的网络模型进行训练,并将训练好的模型在不同的行人检测测试集上进行实验验证,同时对实验结果进行量化分析与对比。通过实验结果表明,本论文提出的算法能够有效实现行人检测的任务,并且相较于其他算法而言,本文算法具有更高的准确率,并且检测运行速度也并没有降低。从而证明了本文算法具有一定的可行性和有效性。
其他文献
抽水蓄能电站的建设改变了河道的过洪段,水流的形态,影响了局部的淤积平衡,使得工程建设在汛期水位壅高,流速变慢,降低了水流的移动速度和挟沙能力,还会导致库中的泥沙淤积,
永磁同步电机(PMSM)伺服系统因其结构简单、维护成本低和速度响应快等优点,广泛应用于工业领域。随着科技的进步,各应用领域对伺服系统性能提出了更高的要求。然而,PMSM中存在力矩波动干扰,降低了系统速度平滑性和位置跟踪性能。因此,利用现代控制算法,设计力矩波动干扰补偿控制器,提高伺服系统的动态性能,具有重要的理论意义和应用价值。本文以PMSM位置伺服系统为研究对象,考虑到周期运行任务下,给定信号和
本文为模拟同传报告,选取2019年俄罗斯小米6月、9月两场发布会原声视频作为模拟同传材料。随着科学技术和现代社会不断进步,世界市场联系日渐紧密,各大科技产品公司发布新品时会举行全球发布会。基于发布会时间长,内容丰富,受众群体众多等原因,现场多采用同声传译作为翻译方式。与新闻发布会等一般会议不同,科技发布会现场空旷,参加人数众多,发言人表述时多科技专业词汇,为活跃气氛还掺杂许多娱乐元素,这就从词汇、
目的通过Klotho基因敲除小鼠模型,探索Klotho基因对小鼠皮肤衰老的影响。方法选取12月龄的野生型小鼠和Klotho基因敲除小鼠各3只,分为两组,即野生型组(A组)和Klotho基因敲除组(B组)。行Western blotting实验对Klotho基因敲除对小鼠皮肤中SIRT1、Klotho及NF-κB蛋白表达进行半定量检测,再做HE染色及Masson染色,观察Klotho基因敲除鼠皮肤形
本次翻译实践选取了Chris Bonner的Designing Environments for People with Dementia,属于医学英语类文本,该书于2005年出版。作为科技文体下的一个分支,医学英语在词汇、句法等方面都有其独特的语域特征,本次翻译实践以语言学家韩礼德的语域理论为指导,探讨了语域理论在医学英语翻译中的应用,结合具体例子分析了语域的三个变量对解决翻译中所出现的问题的适
早期建成的水泥混凝土道路随着服役龄期的增加受到不同程度的损坏,对其进行快速修补加固具有重要的社会、经济效益。磷酸镁水泥作为一种新型绿色胶凝材料,因其早期强度高、凝结时间短、体积稳定性好等特点,在快速修补材料中表现出独特的优势。现有研究对磷酸镁水泥的材料组成、水化机理、工作性及早期强度等方面已取得诸多成果,而关于服役环境对磷酸镁水泥的强度及粘结性能的影响研究还十分缺乏。本文以磷酸镁水泥砂浆为原材料,
近年来,人脸识别已经成为计算机视觉与模式识别领域中挑战性极强且意义深远的研究课题。人脸识别相关课题的研究可分为人脸鉴别与人脸验证,其通过计算机提取并分析面部特征,使计算机对不同身份人脸图像进行识别。目前人脸识别技术给人类生活带来诸多便利,但仍有很多问题需要科研人员不断深入探索与研究。本文阐述了人脸识别研究背景及意义,国内外研究现状,介绍了人脸识别相关技术,提出了一种特征学习的算法并将其与其他特征融
东方经济论坛从2015年开始每年举办一届,旨在加强远东地区同亚太各国之间的交流与合作。多年来,该论坛在世界舞台上的影响力逐渐扩大,成为世界各国关注的焦点。第五届东方经济论坛于2019年9月4日至6日在符拉迪沃斯托克远东联邦大学召开,东方经济论坛也迎来了五周岁的生辰,值此5周年之际,俄罗斯远东发展部整体评估总结了近5年来俄罗斯远东地区取得的成就和经验。俄罗斯远东地区负责人表示,近年来,中方大力投资俄
文艺的人民性是马克思主义文艺理论中一个基础性的理论范畴,围绕人民性这一范畴进行的理论建构,是马克思主义文艺理论在中国化过程中最具标志性的理论成果之一。党的十八大以来,习近平将中国特色社会主义文艺事业提升到了新的历史高度,面对改革开放以来我国文艺事业发展进程中体现出的困难和矛盾,基于回答时代问题的需要,强调社会主义文艺要紧紧抓住文艺人民性这一主线,阐述了社会主义文艺与人民之间的内在统一性,表现出深刻
食品安全一直是科技界和大众关注的热点问题之一。其中,以染料作为杀菌剂残留于鱼类中,给人类健康造成严重威胁。此外,食品中的维生素类有机物过高也会引发疾病。然而,这些物质经常以微量及痕量存在于食品中。因此,制备新的富集材料并建立新的预浓缩方法以提高萃取效率和降低检测成本,具有重要研究意义。氧化石墨烯(GO)和沸石有机金属骨架(ZIF-8)具有大比表面积,稳定性好,易被修饰,吸附性能好等特征,在吸附和分