面向流处理的广告检测系统实现

来源 :复旦大学 | 被引量 : 0次 | 上传用户:hzbhwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着广播电视尤其是交互式网络电视(IPTV)的普及,给人们带来更好的收视效果和更丰富的娱乐节目。与此同时,伴随而来的商业广告日益泛滥,严重影响了观众的视听体验。特别是近年来广告数量呈爆炸性增长,传统的人工审核方式已无法完成海量广告的筛选工作,如何利用科技手段完成不良/非法广告的在线检测,成为了相关部门亟待解决的问题。本课题源于国家863计划《三网融合演进技术与系统研究》,该项目在突破了细粒度视频数据特征分析等关键技术的基础上,形成了面向视频广告检测的示范应用系统。然而,随着视频广告数量的急剧增加,现有采用集中式软件计算架构和串行计算处理模式的系统,已无法满足视频广告检测的实时性要求。本课题针对现有系统存在的实时性不够的问题,从系统软件计算架构角度出发,在分析研究现有典型批处理与流处理两种分布式系统的基础上,探索适合海量数据处理的新型计算架构,主要创新点如下:(1)由于系统核心算法采用串行计算模式,且广告数量急剧扩张,导致现有系统实时性已无法满足实际应用的需求。本文在深入分析影响广告检测系统实时性因素的基础上,提出采用新型计算处理架构的改进思路,使该架构具有数据结构改动小,并行处理能力强,系统响应时间少等特点。(2)研究了两种主流分布式数据计算处理架构,即Apache Hadoop为代表的批处理系统和Twitter Storm为代表的流处理系统,分别从集群组成、计算模型、生态系统等角度进行了分析,在系统的技术路线、计算时效、数据吞吐、系统灵活、容错处理与生态系统等方面进行了性能比较。(3)构建了面向流处理的软件架构,该架构使用了以并行计算为特征的分布式处理模式,采用了基于内存计算的分布式流处理技术,取代现有系统中以串行计算为特征的集中式处理模式,理论分析与测试结果表明,该架构有效提升了系统实时性能。(4)针对现有流处理系统无法实现离线数据深度分析挖掘的问题,本文提出了一种批处理与流处理相结合的新型数据处理架构,该架构具有统一的计算平台、支持超大规模数据的实时计算、面向多种业务需求、计算结果精确灵活、系统易实现与可扩展等优点。
其他文献
综述了近十几年来卟啉试剂合成的进展,收集的卟啉试剂共152 种,分成4 类,即对称型、非对称型、双卟啉型和高分子型卟啉等
期刊
癫痫是儿童神经系统常见的慢性发作性疾病,抗癫痫药物治疗是目前主要的治疗手段,而药物依从性是癫痫治疗过程临床关注的重要问题,如何判断依从性以及在依从性不佳时设计合理
安全管理是建筑施工过程中的重要管理内容,能够为施工现场提供安全保障,要想提高安全管理效果必须要构建完善的安全技术体系。目前在建筑施工过程中存在着较多的安全隐患,必
本文主要研究的是轨道交通车辆制动系统的制动阀。将传统自动式空气制动机中的制动阀由人工控制改为三位三通电磁控制换向阀控制,优化后的电磁阀能实现制动、缓解和保压三种
目的对预防护理干预在糖尿病患者CT增强后对比剂肾病发生率中的应用效果进行分析。方法随机将2018年7月—2019年7月64例糖尿病性CT增强扫描患者分为两组,对照组32例患者予以
Android作为一个专为移动设备设计的软件开发平台,在汽车电子、医疗设备、交通管理、可穿戴设备等领域发挥着越来越重要的作用。随着Android系统在嵌入式开发领域越来越广阔的