基于文本挖掘的视频资源分类研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:hitiger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术高速发展的时代,互联网上多媒体数据以视频、音乐、文字等各种形式充斥着人类的视听,加之实时广播和各种电子设备的启用,使得人们可以轻松播放和存储大量多媒体内容。然而,随着这些数据的爆炸式增长,所占的存储空间也越来越大,其中尤以视频数据最为明显。人们想要手动处理、分析这些视频数据变得非常不可实际。于是,如何有效和快速地将视频数据分门别类,对于提升用户体验,发现潜在的,可利用的商业价值都起着至关重要的作用。研究发现常见的基于视觉特性的视频分类方法,不仅耗时长、效率低且代价昂贵,而文本信息常常见于用户对视频信息的描述、评论、以及所提供的个性化标签数据中,成为一种应用广泛的媒介。加之文本处理技术相对成熟、高效,因此与视频相关的文本信息成为对视频数据分类中最直接,最可行且最有效的特征。本文通过对视频文本描述以及大众化标签数据等进行文本挖掘,设计并实现视频信息分类的主题,主要研究内容为:1.以挖掘出隐藏的视频内容信息为目的,结合视频相关文本描述将文本分类技术应用到基于文本信息的视频分类中,设计视频分类系统实现对于新加入的视频,根据其文本描述信息自动将视频分配到与其内容相符的类别中。2.以文本挖掘中的特征项评估、权重计算为研究重点,提出基于视频文本分类的卡方-信息熵特征项评估方法,并通过实验仿真验证在不同的数据集中,与其他常见特征项评估方法例如信息增益、卡方统计等对比,在不同的视频文本分类模型中,卡方-信息熵算法均具有较高的优越性,能够提高视频分类的准度和精度。3.基于视频文本描述特征进行视频分类的方法,性能好、效率高却由于采用低级的文本描述导致与视频内容之间存在语义鸿沟。因此,本文提出基于社会化网络中大众标签所携带的视频内容及类别信息基础上,结合文本挖掘进一步对视频信息进行分类。4.视频文本描述信息与标签数据并不是相对立的关系,二者互相补充,不可或缺。本文通过概率模型将二者融合并通过实验证明在概率值α=0.5时,视频分类性能效果达到最佳。
其他文献
宽带雷达技术在现代雷达领域备受关注。宽带雷达目标检测作为宽带雷达一体化系统的重要一环,仍有诸多技术难题亟待解决。雷达带宽的显著拓宽使得窄带雷达理论体系的诸多前提条
OPC(OLE for Process Control)是微软公司的对象链接和嵌入技术在过程控制方面的应用,它为工业控制领域提供了一种标准的数据访问机制.OPC的目的就是为自动控制和工业自动化
根据阴极发射材料自动测量系统的要求,本文研究了一种基于PCI局部总线的数据采集模块及其在Windows2000/XP环境下驱动程序的设计。 文中讨论了Windows2000操作系统的特点以
信道盲辨识主要指不需要训练序列而仅仅利用接收端数据以及源发送序列的统计特性和信道的部分特性进行信道辨识。MIMO系统又称多输入多输出系统,它相对于传统的单输入单输出
多输入多输出(MIMO)技术是第三代和未来移动通信系统实现高数据速率、提高传输质量的重要途径。本文对MIMO技术中的空时分层接收技术进行了深入的研究,主要工作如下: 1.研究
随着数据业务的不断增长,人们对公共无线宽带接入的要求已经超过了蜂窝系统所能提供的容量.而无线局域网(WLAN)接入速率远远高于蜂窝网,并且具有一系列独特优点,所以得到了越
本课题是受常州市山林自动化设备公司的委托而研究开发的项目。本项目立足于工业现场的HART协议,主要完成的是对工业现场中HART信号的采集、跟踪、D/A转化和设备报警。实际上是
随着现代科技的发展与社会的进步,车辆出现了爆发式的增长,不仅增加了社会的负担,还降低了管理的效率。如何有效的管理这些新问题是现代社会关注的一个焦点。在这种背景下,智能交
随着Internet的发展,多媒体信息在网上的传输越来越重要,流媒体(Streaming Media)技术以其实时性的特点逐渐在许多领域得到了广泛应用。同时,流媒体也不可避免地面临着版权保护
随着无线技术的广泛应用,无线安全问题越来越受到关注。本文围绕以IEEE802.11为技术的公共无线局域网PWLAN的安全体系展开了系统的研究。研究了提高802.11无线局域网安全的理