【摘 要】
:
现如今,在这个集体安全意识觉醒的社会中,针对人员个体的视频监控系统拥有庞大的需求量。随着智能新科技的蓬勃发展,人工智能因其高效的设计方式、灵活的运用手段等优势,使得广大研究人员集中精力探索其中的奥秘。作为人工智能领域的一个重要分支,计算机视觉被广泛应用于智能安防监控场景中。在大型公众场所的安防监控系统中,会出现重点行人隐匿在人群中或是消失在监控画面中的情况,此时通过肉眼往往难以快速准确的在海量视频
【基金项目】
:
基于智能边缘群网络的人员立体化视频追踪监控与预警系统(KJZ49420200019);
论文部分内容阅读
现如今,在这个集体安全意识觉醒的社会中,针对人员个体的视频监控系统拥有庞大的需求量。随着智能新科技的蓬勃发展,人工智能因其高效的设计方式、灵活的运用手段等优势,使得广大研究人员集中精力探索其中的奥秘。作为人工智能领域的一个重要分支,计算机视觉被广泛应用于智能安防监控场景中。在大型公众场所的安防监控系统中,会出现重点行人隐匿在人群中或是消失在监控画面中的情况,此时通过肉眼往往难以快速准确的在海量视频监控数据中寻找到目标人员。为了使计算机像人类一样理解和描述监控图像中的场景,并高效获取重点人员出现在不同区域时的精准定位信息,常使用跨镜追踪算法进行跨镜头、跨区域的行人检索。目前在跨镜追踪研究领域常常把光照条件良好设定为基本条件,即忽略夜间监控场景的需求,然而这并不符合实际应用场景。在夜间视频监控场景下一般采用的是红外摄像头,传统的基于可见光图像的跨镜追踪算法进行跨区域的行人检索极为困难。本文对于红外图像的行人检测方法以及基于可见光图像与红外图像的行人重识别方法进行了系统的分析和研究,主要工作内容列举于此:(1)研究了计算机视觉领域的基本理论,包括卷积神经网络的组成结构、目标检测算法在行人检测任务中的适配以及行人重识别网络的类别与改进基本点。(2)本文在一阶段检测方法YOLOv5的基础上,引入小目标检测模块,并将其用于红外图像的行人检测任务中,在保证行人检测满足实时性需求的同时,有效提升了对于图像中微小行人的检测精度。通过在红外图像数据集FLIR上的实验结果表明,本方法能够胜任红外图像行人检测任务。(3)本文提出一种基于模态内引导的跨模态行人重识别网络,先对不同模态的图像分别进行特征提取,再将提取到的特定模态特征进行共享特征提取;同时引入模态内引导损失,共同约束跨模态行人重识别网络模型的训练,从而实现在特征层施加约束,在提高两种模态图像统一性的同时,也加强了模态内部的可区分性。在公共数据集SYSU-MM01和Reg DB上的实验结果表明,本文方法具有较高的准确度。
其他文献
在飞机向多电/全电化的发展趋势下,机电作动器(Electromechanical Actuator,EMA)越来越多地应用在飞机上,主要是用在飞行控制系统中。一般作动系统都带有余度,这是为了满足了可靠性的要求,但是其带来的力纷争问题可能会对飞机的性能、结构等造成较大影响,从而降低飞机的安全性。为了研究并解决余度机电作动系统中存在的力纷争问题,本文建立了双余度机电作动系统的数学模型,并设计了EMA的
在过去的十几年间,区块链技术得到了巨大的发展。基于去中心化的公有链搭建的货币系统层出不穷,在全球范围内吸引了大量用户。去中心化的公有链看似是未来金融系统的不二选择,其实不然,公有链系统存在四大缺陷。第一,公有链与中心化金融系统相比,交易吞吐量太低。比特币和以太坊的峰值交易吞吐量仅为每秒7笔和15笔,而VISA峰值为24000笔,支付宝峰值为256000笔。第二,公有链出现了中心化的趋势。比特币和以
“哈龙”灭火剂因破坏臭氧层被禁止使用,寻找环境友好和灭火性能优越的替代灭火剂成为急需解决的焦点问题。民用飞机由于运行环境特殊且一旦发生火灾救援难度较大,所以机载灭火剂除了具备优越的灭火性能还需满足飞机适航性相关标准。民用航空界一致认为与哈龙性能相近的化学灭火气体是最可能的哈龙替代品。然而化学灭火气体数以十万计,性能差异较大,所以研发综合性能优良的新型高效化学灭火气体的工作量较大。而探究化学灭火气体
超声成像是医学成像领域的主要模态之一。深度学习技术具有强大的学习能力,拥有广泛的应用前景。近几年来,超声成像与深度学习技术结合的研究方兴未艾,在波束形成后数据合成、下采样恢复、波束形成等方面取得了一定的研究进展。然而,目前的研究工作还比较有限,代表性工作偏少。波束形成是超声成像的关键步骤,因此探索波束形成与深度学习技术的结合对超声图像质量的提升具有重要意义。由于其强大的学习能力,深度神经网络可用来
飞机在服役过程中承受不同形式动载荷的作用,这些动载荷的确定对故障诊断、设计优化等具有重要意义。但是受限于工程实际中的复杂情况,往往无法使用力传感器直接获取动载荷数据。因此,有必要研究一种基于结构振动响应来间接获取动载荷的技术。本文针对谐波载荷和冲击载荷建立不同的识别模型,基于GARTEUR模型验证载荷识别方法的有效性,基于数值计算与试验相结合的方法探究载荷识别模型的适用性。并以某型飞机全尺寸有限元
伴随着飞机可靠性的提升,人的因素作为保障民航安全和效率的关键要素已被广泛认可。但是近年来,飞行机组因素却已成为诱发飞行事故的重要原因。飞机运行过程中,存在大量的工作应激源,适当的应激反应能够增强飞行机组的警觉性,提升突发事件的处置水平,可是应激反应一旦过强,则会诱发人的差错,严重威胁飞行安全。本研究旨在探究工作任务应激下差错发生时飞行员的多种生理指标参数值的差异,分析差错与应激的关系,对飞行差错进
CCAR33部第21条中明确规定:发动机的设计与构造必须在飞机预定工作条件下提供必要的冷却。气膜冷却在涡轮叶片冷却中起到了非常重要的作用。但是在涡轮设计过程中,为保证航空发动机的安全性和经济性,即在保证冷却效果的前提下将掺混损失降低至最小,快速准确地预估掺混损失成为了一个重要的课题。本文采用数值模拟的方法,围绕叶栅环境下冷气射流与主流掺混过程中对流场与掺混损失的影响这一问题,对相关内容展开系统的研
组合优化是最优化中与算法理论、运筹学相关的一个分支,在人工智能、软件工程、理论计算机科学等领域都有重要的应用。在结构化组合优化问题中,背景数据不是由单一的数据类型构成,而是由存在相互依赖关系的多个数据模块组成。不同问题样例的背景数据维度差异较大,难以用固定规模的机器学习模型处理。尽管已有研究人员尝试借助机器学习方法解析组合优化问题信息模块间的相互依赖关系,但现有的基于学习的组合优化算法仍然缺乏合适
问题生成是自然语言处理的一个热门研究话题,有着丰富的应用场景,可以促进教育、对话系统、阅读理解等领域的研究与发展。最近几年,问题生成领域快速发展,研究学者提出许多方法来生成各式各样的问题。然而,在视觉问题生成领域,目前大部分研究仅仅基于图像来生成问题,而忽略了问题的难度。问题的难度在评估生成问题的质量中扮演着十分重要的角色。为了吸引用户,一个优秀的自动问题生成器应根据用户的能力和经验生成不同难度的
随着信息技术与通讯技术的蓬勃发展,视频作为一种新兴的信息载体越来越受到人民群众的重视。由于成像设备与运输条件的不足,显示端的视频往往存在着分辨率低、质量差的缺陷。因此,能从低分辨率视频序列帧中恢复高分辨率视频帧的视频超分辨率(Video Super Resolution)成为了近几年的一个蓬勃发展的研究主题。而从视频超分辨率的普遍的两种不同评价指标(即重建精度和视觉感知)的角度出发,视频超分辨率可