【摘 要】
:
如今监控拍摄的视频数量日益增加,仅依靠人工分析大量的监控视频图像很难查找到目标,而智能化的视频图像目标检测和识别已经成为了重点研究方向。同时从多个监控视频图像中识别特定行人是城市安全防控的又一大难题,仅依靠人工识别既耗时又费力。因此,本文从检测视频图像中的目标、识别不同行人两个方面,设计了基于YOLOv5的目标检测网络模型以及特征融合结合度量学习的行人重识别方法。以实际生活拍摄的行人图像进行检测和
论文部分内容阅读
如今监控拍摄的视频数量日益增加,仅依靠人工分析大量的监控视频图像很难查找到目标,而智能化的视频图像目标检测和识别已经成为了重点研究方向。同时从多个监控视频图像中识别特定行人是城市安全防控的又一大难题,仅依靠人工识别既耗时又费力。因此,本文从检测视频图像中的目标、识别不同行人两个方面,设计了基于YOLOv5的目标检测网络模型以及特征融合结合度量学习的行人重识别方法。以实际生活拍摄的行人图像进行检测和识别,有效提高了目标检测的精度及行人重识别的速度和准确度。本文主要研究内容如下:1、改进YOLOv5目标检测网络模型,解决YOLOv5目标检测算法精度不高、视频图像中较远目标检测效果不好的问题。首先,将卷积块注意力模块(CBAM)加入到YOLOv5骨干网络,构成CBAM_YOLOv5模型,在基本不增加模型参数的情况下,增强YOLOv5网络提取图像有用特征的能力。其次,在网络的Head检测端使用具有更高拟合效果的CIo U损失函数代替原YOLOv5网络中的GIo U损失函数,从而提高YOLOv5目标检测算法的精度。最后,将改进的YOLOv5网络模型在公共数据集和自制数据集上测试,结果表明CBAM_YOLOv5网络模型有效提升了检测精度。2、使用特征融合结合度量学习方法实现行人重识别。首先,将改进的YOLOv5网络模型检测到的行人图像加入到行人重识别的数据集中,提取行人图像的多特征。其次,在不降低特征表达能力的情况下,对提取的HOG特征及LBP特征进行改进和优化,并与HSV特征进行融合,从而减少融合特征的维度。最后,将提取的融合特征结合XQDA度量学习方法计算行人之间的相似度。利用该方法在公共数据集和自制数据集上进行验证,结果表明本文方法在不降低识别精度的情况下,加快了识别速度。
其他文献
我国关于让与担保合同的争议终于在民法典时代尘埃落定。《中华人民共和国民法典》(以下简称《民法典》)第388条对争议多年的让与担保合同的性质进行了明确,规定其属于“其他具有担保功能的合同”;从《最高人民法院关于适用<中华人民共和国民法典>有关担保制度的解释》(以下简称《民法典担保制度司法解释》)第68条可以看出,该司法解释对让与担保进行了更为细致的阐述,强调在完成权利变动公示后,认可让与担保具有担保
随着数字经济的迅猛发展,数据成为生产方式和生活方式变革的重要驱动力,重要性不言而喻。数据商业价值的凸显和交易活动的兴起使实践中的企业数据争夺战愈演愈烈,学界对数据的法律属性和保护路径争议不断,企业数据权益的民法保护面临多重困境亟待破解。数据表现为数字代码符号,是大数据技术发展的基础,是信息的数字化表达。学界对数据具有财产属性的观点已达成共识,但对客体属性的争议较大,由此导致企业数据权益保护模式的选
中国反腐败治理进入了新时期,对反腐败提出了新要求,但受贿罪的法条存在局限性,使之在应用时出现“举证难”等问题,2016年出台的司法解释未能解决现有的问题,应当回归诠释学路径,通过构造新法益,对受贿罪犯的具体应用进行合理阐释。第一部分,基于现有判例的裁判文书检索,得出16年的贪污贿赂司法解释并未在实务中很好运用这一结论,认为现有的司法解释使用率不高且未能解决疑难问题,应通过构造法益对其进行解释。第二
承继的共犯是共同犯罪的一种特殊形态,其核心问题确定归责范围问题,即后行为人是否应当对先行为人先行实施的犯罪行为以及参与后共同实施的犯罪行为整个犯罪承担责任。绑架罪中需明确承继的共犯如何界定,主要包括了两类行为人,一类是实施绑架,另一类是勒索财物,两类行为人是否构成上述关系,对此司法实务界与学界有很大争议,其根源在于对绑架罪的行为构造以及既遂形态理解不一,如果认为绑架罪是单一行为犯,绑架行为完成时犯
运动目标检测技术的主要目的是将运动物体提取出来,为后续的目标识别和跟踪等提供准确、有效的信息。在医疗领域、军事领域和交通领域等有着广泛应用。但在复杂场景下(如背景变化等)的准确率大打折扣,因此研究一种高效、精准的运动目标检测算法有着重要意义。为了能够准确提取运动目标,本文以视频图像的运动目标检测中的Vi Be算法为主要研究对象,工作概括如下:第一,针对Vi Be算法易受光照等背景变化影响、容易将移
移动互联网和社交媒体平台与现代人的生活紧密相连,大量的文本信息随之出现,问题生成(Question Generation,QG)引起了越来越多研究者的关注。问题生成作为人工智能的一个重要研究领域,通过输入段落和答案的文本信息,生成针对输入序列相关的问题,问题生成对于帮助对话系统、自动诊疗等领域构建或扩充语义知识库,具有重要的现实意义。目前,基于深度学习的方法在自然语言处理领域,能够有效的提取段落和
网络犯罪具有极强隐蔽性。网络犯罪帮助行为具有共犯从属性弱化、法益侵害性升高的特点,其归责路径给传统共犯归责模式带来冲击。文章针对目前学界对网络犯罪帮助行为正犯化的研究,明晰其刑法意义上的概念及内涵。通过整理该议题在国内外的研究现状,梳理其立法沿革,探求网络犯罪帮助行为独立入罪的深层法理。归纳整合主流观点,就相关论争进行对比研究,评价有关罪名性质、共同犯罪解释方案以及罪责刑相适应原则的争议,评析争议
图像描述指采用自然语言描述图像的内容信息,涉及图像信息与文本信息的转换。该任务不仅涉及计算机视觉技术,还运用了自然语言处理的相关技术。图像描述模型采用编码器-解码器框架。在该架构中,首先由编码器将图像转换为中间特征向量,再利用注意力机制对图像的特征区域进行权重赋值,接着将图像特征向量传输到解码器,由解码器生成描述。通用的注意力机制采取图像特征向量和文本向量单层线性融合的操作,而单层的线性融合作用有
三角关系不当得利是不当得利制度中的一种特殊形式,是从各方当事人的数量角度进行划分的。三角关系不当得利并没有法条明文规定,是学理上的概念,其学理较为晦涩难懂,其案例多为错综复杂,实践中存在诸多争议。本文主要围绕三角关系不当得利的构成要件、三角关系不当得利中谁有权向谁主张请求权问题、三角关系不当得利的利益返还范围这三个问题进行论述。首先,三角关系不当得利应采取非统一说,对其进行类型化研究。三角关系不当
轻微暴力致死是指因矛盾纠纷引起的推搡、掌掴等程度轻微的暴力行为却导致了被害人死亡的结果,由于行为与结果之间存在巨大反差,所以在处理轻微暴力致死案件时,司法机关难以对此形成统一的定性,刑法理论界也对其定性问题产生了不同的看法。纵观相关司法判例可以发现,当前有关轻微暴力致人死亡案件的审判,主要存在四种不同的裁决:以故意杀人罪定罪;以故意伤害(致人死亡)罪定罪;以过失致人死亡罪定罪;定性为意外事件。其中