基于内容的新闻镜头分类技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zondy_gongqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和计算机技术的高速发展,多媒体信息,特别是数字视频越来越多的进入人们的生活。如何对视频信息有效管理和利用,是摆在人们面前的重要课题。因此,在理解视频内容的基础上,建立视频的索引、浏览和检索等应用系统,提供给用户方便的视频内容获取方式就成为研究人员努力的方向。镜头作为视频中的结构单元,既可分割成为图像帧,也可组合构造成故事单元,因此在视频内容分析技术中,对镜头进行分析具有十分重要的作用。对视频中的镜头进行有效的分类,一方面,可以极大地缩短低层视觉特征与高层语义特征之间的“语义鸿沟”;另一方面,镜头分类还是视频摘要、索引、检索等视频管理和应用技术重要的支持和保证,具有十分重要的现实意义。新闻视频是内容结构性比较强的视频类型,本文针对新闻视频,设计了一种基于内容的镜头分类方法。该方法将新闻视频中的镜头分为主持人、记者、独白、广告、静态图像以及“其他”六个类型。其中,“其他”指新闻视频中除去另五类镜头后剩余的镜头。主持人、广告、静态图像和“其他”这四类镜头,根据其自身特点逐一检测。记者和独白镜头在新闻视频中是最难以区分的,为此,本文利用一种机器学习方法——条件随机场,将记者和独白镜头的分类转化为序列标注问题,并进行了实验,得到了不错的效果。
其他文献
多播广播单频网(Multicast Broadcast Single Frequency Network,MBSFN)为第三代合作伙伴计划(The Third Generation Partner Project,3GPP)在演进多播组播多媒体服务(Evolve
目前低温共烧陶瓷(LTCC)技术已经成为实现无源元件(包括电感、电容等)集成的关键的主流技术,它在三维多层电路的设计上具有极大的灵活性。借助LTCC技术,很多传统方法无法实现
立体图像可以记录真实的三维世界的信息,使观众产生身临其境的视觉体验,具有广阔的应用前景。目前,立体图像技术已经成功用于科研、军事、教育、工业、医疗等诸多领域,取得了丰硕
目前,我国在音频电子消费产品领域已经具备较强的产业基础,但是由于没有掌握核心专利技术,相关企业长期受制于国外持有标准、专利与技术的企业和组织,专利纠纷成为众多相关企
近年来,国内外宽带网络发展迅猛,IP多媒体技术日渐成熟。数字技术、计算机技术日益与消费家电产品相结合,IP机顶盒就是在此背景下诞生的。目前大多数IP机顶盒产品采用硬件解
无线移动自组网是当前的研究热门,而对于自组网的研究主要集中于对数据链路层MAC协议的研究以及网络层路由协议的研究。由于自组网具有节点自组织、分布式管理、拓扑动态变化
Gr(o)bner基(Gr(o)bner Bases)理论是计算机代数的一个基石,因为不仅可以知道Gr(o)bner基存在性,而且更为关键的是提出了计算Gr(o)bner基的可行性算法,所以无论是在理论上还是在
随着当今世界的科学技术的迅猛发展,无线传感器网络(WSN)不断改变着人类认识世界的方式,其应用相当广泛,可以用于灾害预警、医疗健康系统、城市道路交通监管、军事等诸多领域
扩频通信具有较强的抗干扰、抗侦查和抗衰落能力,可以实现码分多址,目前广泛应用于通信抗干扰、卫星通信、导航、保密通信、测距和定位等各个方面。另外,随着集成电路技术的
在通信设备、雷达、广播设备、微波器件、医疗设备等的设计与生产过程中,经常需要对信号进行频谱分析,同时还需要对信号的多种参数进行测量,如射频信号的频率、功率,调制信号