视频流中的敏感词的实时识别技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:chenfengling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展,网络给广大青少年提供大量学习材料的同时,也给青少年的健康成长带来了不容忽视的威胁。网络上色情、暴力、反动等高度敏感性的信息传播变得非常容易。许多不法之徒通过使用视频中嵌入文字的手段来进行不良信息的传播。相较于单纯的文本类型的敏感性信息,以这样的方式进行传播具有不易被检测等特点。敏感性视频的数据源头既可以是未经审核的互联网视频,也可以是企业内部网络上上传的视频。本文目标是设计一种视频中敏感性的文字检测系统。本文针对文本特征对YOLOv3网络进行改进,通过k-means聚类算法获取先验框尺寸,同时调整网络结构和池化模块,实现文字定位功能;采用融合注意力机制编-解码结构,实现文字识别功能;使用中文分词工具对文本进行分词,对分词后的文本使用两种敏感检测函数进行过滤,第一个过滤函数通过前缀树的方式对文本进行初步的过滤,第二个过滤函数使用传统的SVM对被第一个过滤函数表示为敏感语句的文本进行更深层次的语义检测。测试结果表明,本文方法在满足准确性和实时性要求的同时,能够很好的完成对视频流中敏感词的检测。
其他文献
物联网时代的到来,产生了海量数据,利用机器学习对其进行数据分析,可以从历史经验中提取相关信息,使其产生知识,并利用这些知识做出新的决定。在数据分析领域,技术人员要根据指定数据集构建合适的机器学习模型是一件非常复杂且耗时的事情,在此过程中需要在不同阶段选择合适的算法并不断调整优化算法参数,往往需要多次探索才能得到最终结果,对技术人员有很高的专业背景要求。针对于数据分析领域中算法选择难、调优难的问题,
近年来,物联网的发展日新月异,并在各个领域的应用场景下产生了实际的作用。伴随着机器学习算法的飞快发展和光伏硬件的不断更迭,使得光充能物联网体系有了更大的优化空间。因此,如何通过合适的模型降低网络能耗,延长网络寿命成为了可充能物联网领域亟待解决的问题。现有光充能物联网研究通常存在如下欠妥之处:1.现有光充能预测算法模式单一、忽略了小型传感器节点易受环境影响的因素,导致预测算法准确度降低。2.现有光充
地震是一种巨大的自然灾害,给人类社会的生命财产安全带来了极大威胁,能够提前预知地震的发生并做好相应措施是十分有必要的,因此地震预测是一项非常重要的任务。一直以来,地震预测的相关专家一直在探索更为准确的地震预测方式,他们也产生了很多流派,但是这些方法都存在以下缺陷:首先地震数据的获取较为困难,其次传统方法只能预测地震一个维度的信息,例如震级或经纬度,预测信息缺少完备性。针对以上这些问题,本文提出了一
互联网技术的发展推动网络购物蓬勃发展。越来越多的商品信息被上传到网络上,用户在面对数以亿计的商品往往会无法一下子明确自己的购买意愿,这对于商家以及用户都是一种损失,商家有可能错过对自己商品有隐性需求的用户,用户则会在浏览大量商品的过程中浪费大量的时间。通过研究个性化推荐能够在一定程度上解决上述问题。在推荐算法计算过程中,相对于更为稀少的显示反馈数据,用户的隐式反馈数据更加容易获得,数据量也更大。但
氧化铝原矿浆制备作为拜耳法生产氧化铝工艺流程的第一步,其制备的原矿浆是后续工序的原料,原矿浆的合格率最终影响到氧化铝的质量和产量。因为氧化铝原矿浆成分的化验结果存在大滞后性,通过预测原矿浆成分调节制备过程的配料量有着必要性和重要意义。本文研究了氧化铝原矿浆成分预测模型以及实际应用,具体内容如下:(1)对采集到的国内某铝厂氧化铝原矿浆制备生产原始数据进行可视化展示,分析数据集各参数统计量,并进行数据
随着网络技术的快速发展和互联网使用成本的降低,网民数量正逐年增加,越来越多的人倾向于在网络平台发表如商品评论、热点话题评论等大量带有情感色彩的文本信息,分析这些主观性文本可以更好地理解用户的情感态度,具有一定的商业应用价值。如何从海量的非结构化文本中挖掘出有价值的信息成为研究的热点之一。情感分析作为自然语言处理的子任务,旨在从文本中分析出人们对于某个实体或属性的情感倾向。传统的粗粒度级情感分析只能
随着开源社区的出现和飞速发展,越来越多的软件选择了拥抱开源,基于开源代码的软件开发逐渐成为新的软件开发生态。然而,开源软件在版本迭代中较少进行重构活动,导致软件结构越来越复杂,软件质量也被侵蚀,给基于开源代码的软件开发带来一定的困难。不仅如此,可供软件开发人员重构的功能往往来自多个不同体系结构的开源软件,如何快速地从中重构出所需功能是软件重构亟需面对的问题,所以开源软件重构是软件重构技术中一个重要
随着云计算、物联网等技术的不断发展,各种形式的数据不断涌现,大量的数据服务也应运而生。传统的“请求/响应”的数据服务模式限制了服务的响应速度和自动化程度,已经无法满足各领域智能化和信息化建设的需求。主动服务是无需人为驱动、能够自动根据逻辑判断提供的数据服务,其出现打破了传统数据服务模式的局限。为了实现主动服务中逻辑的自动判断,本文对面向主动服务的情境认知算法进行研究。主要的工作有以下三点:1)为了
随着信息科技的发展,网络中的数据规模越来越大,这些数据给现有的检索系统带来了挑战,如何从驳杂的数据信息中检索到准确的答案越来越受到关注。问答系统作为检索系统的一种高级形式,能够对网络上海量的文本数据进行分析检索并返回给用户简洁而准确的答案,已成为了一项新的研究热点。问题分类是问答系统研究的一项基本任务,其精度直接影响问答系统的性能。目前问题分类任务主要面临以下问题:一方面是数据集中问句字数较少,存
伴随城市化发展,旧城更新改造带来的问题越来越多,特别是在老城区中进行深基坑项目施工时其安全隐患尤为突出。本文针对老城区更新改造过程中深基坑开挖对周边环境及毗邻隧道的安全影响特点及其防控技术进行研究,对深基坑支护方案进行了优化设计,并对周边环境安全提出防控措施。主要研究内容如下:(1)针对深基坑与周边环境特点,根据工程地质勘探资料设计了地下连续墙、桩锚与地下连续墙联合支护及土钉支护三种不同结构形式的