基于听觉及视觉双重特征的不良视频场景识别

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:nkivy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前网络不良视频传播呈逐步上升态势,带有各种色情、暴力等内容的视频的传播,不仅对社会风气和群众身心健康造成了不利影响,也是诱发很多刑事犯罪的主要原因之一。遏制不良视频内容的传播,不仅需要制定严格的法律法规,也需要相关判别审计技术的支持。因此,研究网络不良视频识别相关技术已成为非常紧迫的任务。   视频场景是对视频中某一特定事件的完整表述,通过某种视频场景,可以确定视频数据中是否包含相关特定的内容。因此,在网络不良视频审计中,通过识别不良视频场景进行不良视频内容判别是一种有效途径。视频场景在本质上是听觉、视觉等信息交互融合的结果,仅通过单一特征不能完整地表达场景内容。本文通过分析不良视频中的听觉特征和视觉特征,再融合听觉及视觉特征的方法来识别视频中的不良场景。文中首先根据不良视频数据中听觉信息的特点,提取相应的音频段特征,结合使用动态时间归整(DTW)算法和隐马尔科夫(HMM)模型识别出听觉信息中的不良语音段。然后在不良语音段所在的时间内进行关键帧提取,分析和提取了关键帧的特征,并融合多重特征判断视频关键帧之间的相关性。通过处理视频数据中的听觉信息和视觉信息后,所构造的视频场景即为在特定时间段上相关的关键帧组合,最后通过检测不良关键帧来判断所构造场景是否为不良场景。融合听觉及视觉特征的不良视频场景识别为不良视频审计提供了一种可行方法。   实验结果表明,本文的方法能够有效的融合视频数据中的听觉信息及视觉信息识别出视频中的不良场景,为判断视频内容为不良内容提供了可靠保证。
其他文献
放疗计划系统是连接临床和放疗设备的纽带,医学图像数据管理是一个性能优良的放疗计划系统所不可缺少的部分。放疗计划数据管理系统涉及到医学图像数据库、图像处理及医学相
由于在军事与民用等多个领域中广泛的应用前景,无线传感器网络已成为工业界及学术界关注的热点。传感器网络通过监测现实世界,获取感知数据,并将信息传送给用户,最终让物理世界与
半监督聚类算法是目前机器学习和数据挖掘领域的一个研究热点,吸引了众多学者对该领域进行研究,并取得了一定的研究成果。本文对半监督聚类算法进行了研究,提出了一种基于凸
在移动通讯呼叫网络中,每一个移动通讯用户构成一个节点,用户之间的通信交往构成他们之间的联系,由此形成移动通信社会网络。社会关系网络在通信企业的营销中起着重要的作用
在公共领域,群体事件逐渐凸显,各个政府部门急需建立针对应急事件的信息化服务平台,以便实时了解事态发展,统一进行战略部署,及时作出科学有效的决策。随着移动通信技术的飞
移动Ad-hoc网络(Moblle Ad-hoc Network,MANET)是4G无线通信网络中的重要研究课题,目前已成为无线通信技术领域中研究的热点问题。移动Ad-hoc网络是由无线移动节点组成的具有移
立体视觉匹配问题是立体视觉中的关键问题。它的主要任务是寻找同一场景点投影到图像中的像素之间的对应关系,进而求出场景点的深度信息。经过近二十年的研究,国内外研究人员提
RFID(Radio Frequency Identification,无线射频识别)技术是一种非接触的自动识别技术,兴起子20世纪90年代,并在近年来,广泛应用于物流、防伪、医疗、食品安全、商业供应链和生产制
DoS(Denial of Service,拒绝服务攻击)是对网络服务有效性的一种破坏,使受害主机或网络不能及时接受并处理外界请求,或无法及时回应外界请求,从而不能提供给合法用户正常的服
云计算作为一种新的计算模式,实现了人们长期以来“把计算作为一种资源”的梦想。由于云计算方便快捷的特性和灵活的收费方式,很多企业和用户都愿意将他们的数据外包给云。用