Web内容安全分析及算法研究——新闻逻辑单元分割理论及算法

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lb_124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
今天,Web页面中存在的多媒体信息由于关系到社会治安和人们的文化生活,其内容安全性越来越被人们所重视,而其中Web视频信息内容安全性的分析又是最困难和最复杂的部分。由于现今许多学者在视频检索方面做了很多的工作,若把视频检索技术用于Web视频的语义提取,就可以方便的找到Web视频对应的语义信息,从而确定其内容的安全性。要达到这个目地的第一步就是找到视频的最小语义单元,即故事单元。而Web视频中又数新闻视频影响最大,于是本文在’参考了相关工作的基础上提出了一种多模型融合的新闻逻辑单元分割框架。 框架大致分为三层结构,最底层是特征提取层,这一层用于提取大量的视频、音频特征。本文在特征提取层提出了主题特征、人脸个数和人脸位置等新的特征。中间层是镜头标注层,这一层主要用于对每个镜头进行标注,标注的内容是每个镜头通过决策树分类之后的类别。为了对镜头分类的结果进行校正,本文在镜头标注层提出了一个内容相似性比较模块。最上端一层是故事单元抽取层,主要功能是利用隐式马尔科夫找到故事单元的分界点。本文在故事单元抽取层提出了一个基于启发式规则的预分割模块,用于减少模型的训练量和提高精度。 本文的试验结果是通过一个半自动的系统得到的,对不同电视台的新闻进行测试,平均的F1值达到71.9%,其中CCTV-9达到了81.5%。
其他文献
目的:分析综合护理干预用于垂体瘤手术患者的影响.方法:选取2018年10月-2019年5月间我院78例垂体瘤患者,随机等分为2组,参照组39例患者行常规护理,研讨组39例患者行综合护理
随着多媒体数字化、网络互联和流媒体技术的飞速发展,使通过各种网络观看数字化的高质量的媒体节目成为可能,再加上Internet上丰富的媒体资源,在线收看节目越来越受网络用户
目的:评价对老年重症肺炎患者实施全方位护理的临床效果.方法:纳入58例老年重症肺炎患者,收治时间2017年9月至2018年11月,根据入院顺序先后分为常规组、全方位组,分别予以两
目的:分析全面护理在脑肿瘤患者术后护理中的临床效果以及并发症发生率的情况.方法:选择脑肿瘤患者(100例),选择时间为2018.2.22-2019.2.23,通过动态化随机分组的方式将选择
目的:探究海参水煮液多糖提取物外抗炎活性.方法:建立行诱导建立的炎性因子模型,将海参水煮液注入模型中,通过检测模型中炎性因子,分析海参水煮液多糖提取物的抗炎活性.结果:
FAM3B,又称作胰腺衍生因子(PANDER),是FAM3家族成员之一。之前报道的编码235个氨基酸残基的分泌型FAM3B主要在胰岛的a细胞和B细胞中表达,已有的研究提示分泌型FAM3B可能在生理情
DNA条形码技术2003年由Hebert提出,根据标准线粒体基因COI基因658 bp左右的片段,通过种内和种间遗传距离差异的原理,快速、简便、廉价地进行物种鉴定,并在昆虫、鱼类、鸟类、
目的:探讨神经外科重症监护室脑出血患者肺部感染的相关危险因素及护理对策效果分析.方法:回顾性分析自2018年1月至2018年12月收治的73例神经外科重症监护室脑出血患者的临床
本文研究了MIMO数字通信信号的盲均衡与识别问题。MIMO系统的独特优势使其成为新一代通信技术的关键技术。近年来也涌现出了许多调试识别的新方法和思路。本文在借鉴前人已有
SATA(Serial Advanced Technology Attachment)作为一种串行接口,以其传输速度快、支持热插拔、内置数据/命令校验单元等特性广泛应用于机械硬盘和固态硬盘上。  本文在详