【摘 要】
:
本文提出的多模式视频检索方法,是从视频语义特征的角度构建视频数据的语义特征库,将与视频语义相关的声音、字幕、音乐、剧情脚本、新闻文稿等信息特征进行整合,以人像、字
论文部分内容阅读
本文提出的多模式视频检索方法,是从视频语义特征的角度构建视频数据的语义特征库,将与视频语义相关的声音、字幕、音乐、剧情脚本、新闻文稿等信息特征进行整合,以人像、字幕、语音、视频镜头识别和剧情脚本分析的组合技术,建立视频数据语义特征的多模式提取模型,将语音识别引擎、OCR引擎集成在检索平台中。本文提出应用语音与音乐的临界点为场景的分割点,以说话人音色变化的临界点为镜头的分割点。本文提出的利用剧情脚本中的描述信息与字幕、语音、人像提取的特征匹配的方法,来实现对视频数据诸如人物名称、台词内容、主演人的检索。并根据剧中的代表场次图像帧,利用文献[46]改进的最近特征线法(nearestfeature line,简称NFL)算法对镜头进行基于内容的检索具有一定的创新性。在视频数据流描述的模型建立、同期化、压缩及安全机制方面,本文给出了空间性、时间性、描述多样性的基于四维矩阵的运动影像与音频数据的表示形式。把视频流看作是图像与音频数据以一种持续的密切结合的形式组成的数据流整体。这种表示形式提高了数据压缩率和视频(或多媒体)数据库系统及播放系统的QoS。并提出在主动网络体系结构下解决视频数据流的网络安全机制的方法。
其他文献
本论文是一篇阐述当代建筑结构表现力的理论论文。 当今社会,技术的高度发展为建筑的多元表达提供了多种可能。作为技术的物质载体——结构和表皮,建筑师自觉或不自觉的将
阿尔茨海默病(AD)脑细胞能量代谢降低,是否与线粒体DNA(mtDNA)损伤有关,迄今国内鲜见报道。祖国医学认为人参皂甙能“延年益寿、益智”,现代医学认为其有抗氧化损伤、抗凋亡
本文从马克思的“社会扣除理论”以及分配理论对税收分配的指导性作用入手,运用税制优化原理,分析中国现行税制的运行状况及存在的问题,提出最适课税理论对我国税制建设的启
本文针对如何准确测量K712型姿控固体火箭发动机瞬态推力进行了一系列的分析研究。由于发动机推力测量系统的固有频率远远低于所测量瞬态推力的频率,使得推力传感器的输出不
山楂是一种重要的前花青素(procyanidin,简称PC)的潜在资源。针对目前有关山楂前花青素的研究现状,本文开发了两种用于评价山楂原料、提取物及其制品中前花青素含量的分析方法,
目的:通过特异性 TLR2、4 抗体检测 HepG2 细胞表面 TLR2、4表达情况,并探讨 LPS 对其表达的影响。 方法:不同浓度的 LPS 刺激 HepG2 细胞后,先以免疫细胞化学方法证实 HepG2
随着历史的进步和社会的发展,作为人类文明标志的图书馆也在不断地发生变化。网络环境下的图书馆是对传统图书馆的继承和发展,如何充分地实现网络环境下图书馆的社会价值,有
在国家某“863”工程项目中,需要研制一种大功率低压输入的 DC/DC 变换器电源。在充分考虑国内外不同 DC/DC 变换器拓扑特点的基础上,本文选用了推挽正激电路作为系统的主电
谷氨酰胺转胺酶是一种能催化酰基转移反应的酶。吸水链霉菌是一新筛选的产谷氨酰胺转胺酶的菌种,本文主要研究了吸水链霉菌发酵生产的谷氨酰胺转胺酶(MTG)的分离提取及其酶学
直接言词原则是现代刑事诉讼基本原则之一,它在许多国家刑事诉讼立法和实践中得到确立和贯彻。该原则有助于司法公正的实现和诉讼效率的提高。虽然在我国刑事诉讼法及有关司