基于嵌入式软硬件协同设计的目标检测跟踪研究与实现

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:vpnyoyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测和跟踪是计算机视觉领域的基本内容和研究热点,随着人工智能的飞速发展,掀起了目标的检测和跟踪技术在不同领域的研究热潮。由于实际应用场景中,通常存在着摄像机抖动、相似目标混淆、光照变化、运动模糊等复杂因素的干扰,为检测跟踪任务带来的巨大困难。目标的检测跟踪通常是在PC机上实现的,随着近几年边缘计算平台性能的提升,特别是基于ARM与FPGA的异构嵌入式系统出现,因其在功耗、体积、成本和实时性上的诸多优势,推进了基于片上系统的目标检测跟踪技术的深入研究与广泛应用。由于嵌入式系统计算资源的限制,大量精度较高的检测跟踪算法难以在嵌入式系统实现或难以满足实时性要求。本文提出了一种适用于嵌入式系统的融合属性识别的目标检测跟踪算法,并将该算法在嵌入式系统上实现,论文的主要工作包括:(1)当前的计算机视觉领域需要从图像中提取更多的语义信息,另外为避免检测跟踪结果中多个相似目标的混淆,本文在检测跟踪算法中引入属性识别算法筛选出特定目标,由于嵌入式系统的计算资源有限,设计了轻量化的多任务共享特征提取网络算法结构,为提高多任务的整体识别精度,优化了损失函数,在损失函数中基于分类难易程度确定不同任务的损失权重。实验表明属性识别算法模型的体积和计算量较小,满足嵌入式系统的实时性需求,且算法具有较高的识别精度,能有效区分相似目标。(2)在核相关滤波跟踪算法中,由于缺乏有效性检测机制,在复杂环境中模型容易受到污染,导致误差积累进而导致跟踪失败。本文提出基于感知哈希算法的跟踪有效性检测机制,及时判断当前跟踪结果是否有效,避免跟踪失败。(3)目标检测模型中,只对当前帧单独检测,并不考虑前后帧的相关性,在恶劣环境中容易出现漏检。本文提出防漏检策略,在核相关滤波算法采用单一的HOG特征基础上引入图像增强后的Lab颜色特征,有效降低了漏检率。(4)将本文所设计的算法部署到嵌入式软硬件中,为提高算法的实时性,结合Zynq芯片特征,采用软硬件协同设计的方式实现。由于卷积神经网络计算大,对内存读取带宽要求较高,本文首先将目标检测模型和属性识别模型经过量化压缩减小体积和计算量,然后将可并行程度较高的部分部署到FPGA中实现,算法中其他计算量不大的部分由ARM实现,充分发挥了ARM和FPGA各自的优势。实验表明,本文提出的融合属性识别的检测跟踪算法能够实现在复杂场景下对目标的稳定跟踪,准确率和成功率分别为91.19%、84.79%,相对于KCF跟踪算法分别提高了21.48%和25.85%。在对算法中的SSD模型和属性识别模型的量化过程中,精度损失都在1%以内,对整体算法基本无影响,在嵌入式软硬件系统上帧率为23.5 FPS,基本满足算法实时性要求。
其他文献
会展业作为新兴的第三产业蓬勃发展,已经成为世界经济的重要组成部分。与传统产业相比,会展业有许多突出优势,如高效益、无污染、拉动经济能力强、社会影响力巨大等等。为响应澜湄合作机制,D公司发起举办澜湄合作博览会。展会采用政府引导,市场化运作的运营方法,目前遇到了招展困难等现象。本文以澜湄合作博览会为研究对象,从展会促销这一方向展开研究,以目标营销战略理论和促销理论为理论基础,并通过访谈调查发现提炼展会
数字全息术将传统光学全息术和数字图像处理技术相结合,可以记录和显示物体的三维信息,在众多领域中得到了广泛应用。由于激光源具有高相干性,照射到光学粗糙表面的物体上,造成散射光的随机干涉,形成散斑噪声,不同于非相干的加性噪声,散斑噪声是一种非常难处理的乘性噪声,散斑噪声的存在严重影响了重建图像的质量,因此,散斑噪声的去除在数字全息领域必不可少。本文首先对散斑噪声的成因进行了研究,由散斑的统计特性可知,
随着社会发展,生态环境问题日益受到人类重视.近些年来,学者们通过研究基于实际情况建立的生物种群模型,获得生物种群的发展变化规律,所得结果为保护稀有物种,管理生态资源,维护生态平衡提供了关键性策略,具有重要实际意义.本文基于实际建立了几类有脉冲、时滞和扩散等因素影响的生物种群模型,利用脉冲微分方程理论、Mawhin重合度理论、李雅普诺夫泛函和一些分析技巧,研究系统解的存在性、全局吸引性、持久性等动力
知识表示学习(KRL)旨在将知识图谱所包含的实体和关系嵌入进张量表示空间当中,从而在表示空间中完好地保存图谱的语义和结构信息,该技术广泛应用于自动问答、信息检索等各式各样的领域中。然而,先前工作的嵌入式表示学习结果往往是通过同质学习策略所获得的,即在学习过程中平等地对待每个实体和每个关系,从而忽略知识图谱所固有存在的不平衡性与异构性。因此,知识表示学习算法需要针对知识图谱的复杂结构进行改善,算法学
厌氧颗粒污泥具有活性强、结构稳定和沉降性好等特点,不仅能够保持反应器内具有较高的污泥量和良好传质效果,还可促进反应器的快速启动及高效稳定运行。为了快速培养颗粒污泥,本文在自制高传质内循环厌氧反应器中、对接种污泥进行预处理及在高负荷启动、高提升负荷的工艺条件下,研究了反应器启动特性、颗粒污泥形成及特性、颗粒污泥对反应器重新启动的影响、新建乳品废水厌氧反应器启动运行及颗粒污泥的形成,结果表明:1、厌氧
我国煤炭产量位居世界首位,2020年统计数据显示,煤炭原煤产量超过38亿吨,达到38.4亿吨。相比于巨大的煤炭生产量,煤炭需求量却严重不足,产能过剩问题突出。煤炭企业为了抢占市场份额,谋取利润,竞相为客户提供信用政策,即采取赊销的方式结账。一方面,赊销政策是激烈市场竞争中增加销售收入的必要手段;另一方面,随着赊销政策使用频率的激增,应收账款占资产比重与日俱增,把控风险对企业来说越来越重要。因此,如
学位
树木年轮是包括林学、生态学、树木年代学在内的许多学科领域重要研究对象之一,但现有的商业年轮测量与分析软件价格十分昂贵;另一些免费软件缺乏图形用户界面、兼容性差,这
随着科技的发展,智能结构在航天航空的应用越来越广,因其自身阻尼较低的特点,对其在受外干扰下产生的振动进行控制具有非常重大的意义。智能结构是集驱动、传感、控制器及结构一体化的智能系统,特别是压电作为驱动元件的智能结构。智能材料可以对外界的压力,电等物理量的刺激做出响应,使自身发生形变,并把这些作用转换成电能,从而利用这种驱动特性来抑制智能结构的振动。本文以压电陶瓷和柔性悬臂梁结合而成的智能悬臂梁为研
对于视觉语义嵌入这一任务,现有的方法往往以双极化的方式对待查询样本与候选样本之间的相关性。对于模型而言,这些候选样本只能被看作为与查询样本完全相关或者完全不相关。其中,所有的“不相关”候选样本都会在嵌入空间中被以相同的边距均等地推离查询样本,而它们与查询样本之间实际上多样化的相关性则被完全忽略。这一实践忽视了数据之间相对的区分性信息,并且会在检索任务中带来次优的排序结果,以及更差的用户体验。尤其是
近年来,随着移动互联网的迅速发展,电子商务领域也随之获得了前所未有的蓬勃生机,各种大中型电商网站纷纷应运而生。然而网上商城店铺众多并且各色商品种类繁多,鞋类图像数据呈几何式增长,但大量的鞋类图像不能被有效地利用,如何在海量的鞋类图像资源中快速、准确的检索到鞋类图像,成为亟待解决的问题。为此,本文为了解决现有的鞋类图像检索较少地利用语义属性以及检索对象局限于粗粒度导致检索精度较低的问题,提出基于部件