基于深度学习的视频监控排序方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ttmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能技术的不断发展为智慧监狱的建设提供了很多帮助,给实时监控要求很高的监狱监管部门提供了许多便利。相比于传统的视频监控推荐方案,基于深度学习的智能推荐技术能够在降低监狱管理人员监控视频观看强度的同时为观看人员提供更加合适的监控视频,从而在一定程度上减轻监狱管理人员的工作负担,提高监狱对服刑人员活动监管的效率。目前推荐系统技术主要应用在电子商务领域,技术方案几乎都是根据用户的身份标识和推荐对象的特征信息进行匹配给出个性化的推荐方案。而在监狱视频监控推荐的应用场景中操作人员信息通常是不确定的,用户的身份特征和操作对象的物品特征无法获得,这使得传统推荐技术中协同过滤一类的方法很难应用到监控视频推荐上。如何更好地利用监控操作对象序列尤为重要。
  近年来许多研究人员利用循环神经网络隐节点状态保存序列重要历史信息,加上注意力机制关注序列物品不同重要程度的推荐方案在序列推荐问题上取得了明显的成效。但是,现有基于注意力机制的循环神经网络方法都没有明确地利用到点击序列中的物品转移方式、不同时刻点击操作对象的间隔时长以及不同时间距离的上下文局部特征。为了解决这些问题并结合监狱监控场景中的实际情况,本文在现有成果的基础上做了进一步改进,主要的创新点如下:
  (1)首先我们把操作组织中不同时刻操作对象的时序转移方式通过位置感知的序列建模方式进行嵌入表示,通过引入图结构数据嵌入和位置编码的方式对操作对象的转移方式和依赖关系进行建模,并利用门限函数来控制局部特征的保留与舍弃。这种方法能够考虑不同操作对象之间更深层次的时序依赖关系和转移信息,从而更准确地表示操作对象的嵌入信息,提升最终的推荐效果。我们用山东省两个重点监狱的视频监控日志验证了本文模型的效果。
  (2)针对传统方法只考虑了时序信息和上下文信息,忽略了序列中不同时间距离特征对于最终结果影响程度的不同,本文还提出了长短期注意力机制的网络结构来探索用户局部行为对全局特征的影响程度。在现实任务中,操作用户的意图具有时间转移性,我们对不同时间范围的操作序列采取了不同的注意力机制进行更具针对性的用户意图获取。本论文模型的分段注意力网络在保留循环神经网络处理时序时序数据有点的同时采用不同机制的注意力结构来克服长距离依赖限制,它能够同时考虑到操作对象组织中长期和短期的操作对象对全局组织的不同依赖关系,将不同时间间隔对象群体对于操作组织的影响程度进行不同的特征表示。模型在两个山东省监狱数据集上的实验结果也证实了该网络结构的有效性。
其他文献
说话人性别和年龄识别是自然语言处理技术的一个子领域,是一项具有挑战性的任务,在人机交互系统中通过说话人性别和年龄特征识别,可以实现为特定对象提供个性化服务。随着人机交互系统的深入研究,用户体验的要求越来越高,该技术逐渐在自动语音查询信息、无人超市、健康护理、娱乐等领域得到广泛应用,并且有望在未来持续增长。  针对语音信号特征提取和建模算法容易受环境噪声影响,性别和年龄识别准确率偏低,年龄识别易出现
海水淡化是有效缓解当前全球性水危机的重要途径。静电雾化太阳能海水淡化技术使用太阳能作为热源,对环境适应性强,并利用静电雾化技术快速扩大单位体积海水表面积,降低雾化海水颗粒粒径,提高热传导效率和蒸发效率。本文通过对液滴在耦合场中的运动力学分析沉积区域控制技术,使得雾化海水颗粒运动至太阳能集热装置有效集热区域,提高海水蒸发效率,并基于研究结果完成了太阳能静电雾化海水淡化系统的自主设计。  本文采用数值
学位
无叶片风力发电系统通过感应荷电雾化装置将液体介质雾化,在风的作用下,雾化后的带电液滴往电场力的反方向运动,从而增加系统的整体电势能,实现风能到电能的转换。液滴荷电雾化是系统中的关键环节,对液滴荷电机理及电荷转移特性的分析,可为雾化系统参数的优化匹配提供参考,以提高系统总的电势能及能量转换效率。  本文通过理论分析、实验对照等方法对静电场作用下的液滴形态变化规律和表面电荷分布规律进行研究:基于双电层
随着无线通信技术和物联网技术的发展,室内定位的应用需求越来越多。超宽带(Ultra-Wideband,UWB)通信技术凭借其精度高、传输速率高、复杂度低、功耗低、穿透能力强、抗干扰性好等优势,在高精度室内定位领域被广泛使用。室内定位系统的难点包括:多锚点多标签环境中的无冲突通信和定位;定位网络中,节点加入和退出网络等网络管理;多锚点环境中标签定位锚点的实时切换。  针对以上难点,本文基于超宽带通信
该篇论文对添加剂改善微波陶瓷BaNdTiO的介电性能及其机理进行了研究和探讨,微波陶瓷BaNdTiO系统的介电能包括介电常数εr、品质因数Q温度频率系数τf等,这一系统主要具有优良的介电常数εr(80-90),但频率温度系数τf较高(+85ppm/K),需要另加入添加剂来进行调节,以满足实际应用中的需求.该篇论文主要研究利用添加剂PbO和BiO对频率温度系数进行了调节,不同百分比的PbO和BiO添
学位
该论文采用等离子体增强的化学气相沉积(PECVD)生长技术,原位制备了SiO/nc-Si/SiO的纳米结构.实验中我们首次采用等离子体氧化的方法,获得了作为隧穿氧化层超薄SiO层,并利用layer by layer的方法制备了纳米硅层,然后再用等离子体氧化的方法形成栅氧化层.我们通过对基于硅纳米晶粒的MOS结构的电容电压(C-V)测量,研究了硅纳米晶粒的电荷存储现象.
超宽带(Ultra Wide Band,UWB)通信系统可以利用频带极宽的信道来传输信息,与传统窄带通信系统相比具备更高的传输速率,是未来通信行业研究的热点问题,进行准确的信道估计是保障超宽带通信系统可靠性的关键因素。传统的超宽带信道估计方法,在估计精度、频谱利用率上均有待提升,而压缩感知理论通过利用稀疏信号的特性,能够以较高的估计精度完成超宽带信道估计工作。本文旨在通过对压缩感知理论中重构算法的
空间信号的波达方向(Direction of Arrival,DOA)是指利用传感器阵列接收的信源信息,提取出空域信号的角度参数,从而确定信号发出的位置。经过多年的研究,出现了测向性能较好的超分辨测向算法。论文主要对超分辨测向技术关键问题展开深入研究,包括窄带独立信号DOA估计的优化改进、色噪声背景下相干信号测向实现、宽带混合信号DOA估计。论文首先研究窄带信号、相干信号、宽带信号模型,然后对几个
近年来,语音识别深入应用到各种不同的场景,抗噪能力也成为语音识别系统评价指标之一。语音识别系统主要包括声学模型和语言模型两部分,声学模型主要基于DNN-HMM搭建,提取MFCC特征系数作为声学模型的输入,语言模型则使用LSTM网络进行搭建。本文所搭建的强噪声环境下的语音识别系统中,声学模型基于DRSN-HMM搭建而成,得益于DRSN的独特结构,DRSN-HMM具有良好的去噪性能;语言模型基于LST
学位
在深度学习方法快速发展以及海量视觉数据可利用的背景下,计算机视觉领域近年来发展出多种视觉理解方法,旨在辅助机器理解和分析视频及图像的语义信息。图像翻译作为视觉理解的一种常见方法,其关键在于学习到一个可在图像域之间进行变换的映射关系,利用神经网络学习源域内容,然后将其转换到目标图像域空间。人类生产生活中的很多问题都可以转化为图像翻译的子任务,例如在自动驾驶领域,将车载摄像头拍摄的街景图转换为目标分割
学位