论文部分内容阅读
在信息技术高速发展的时代,互联网上多媒体数据以视频、音乐、文字等各种形式充斥着人类的视听,加之实时广播和各种电子设备的启用,使得人们可以轻松播放和存储大量多媒体内容。然而,随着这些数据的爆炸式增长,所占的存储空间也越来越大,其中尤以视频数据最为明显。人们想要手动处理、分析这些视频数据变得非常不可实际。于是,如何有效和快速地将视频数据分门别类,对于提升用户体验,发现潜在的,可利用的商业价值都起着至关重要的作用。研究发现常见的基于视觉特性的视频分类方法,不仅耗时长、效率低且代价昂贵,而文本信息常常见于用户对视频信息的描述、评论、以及所提供的个性化标签数据中,成为一种应用广泛的媒介。加之文本处理技术相对成熟、高效,因此与视频相关的文本信息成为对视频数据分类中最直接,最可行且最有效的特征。本文通过对视频文本描述以及大众化标签数据等进行文本挖掘,设计并实现视频信息分类的主题,主要研究内容为:1.以挖掘出隐藏的视频内容信息为目的,结合视频相关文本描述将文本分类技术应用到基于文本信息的视频分类中,设计视频分类系统实现对于新加入的视频,根据其文本描述信息自动将视频分配到与其内容相符的类别中。2.以文本挖掘中的特征项评估、权重计算为研究重点,提出基于视频文本分类的卡方-信息熵特征项评估方法,并通过实验仿真验证在不同的数据集中,与其他常见特征项评估方法例如信息增益、卡方统计等对比,在不同的视频文本分类模型中,卡方-信息熵算法均具有较高的优越性,能够提高视频分类的准度和精度。3.基于视频文本描述特征进行视频分类的方法,性能好、效率高却由于采用低级的文本描述导致与视频内容之间存在语义鸿沟。因此,本文提出基于社会化网络中大众标签所携带的视频内容及类别信息基础上,结合文本挖掘进一步对视频信息进行分类。4.视频文本描述信息与标签数据并不是相对立的关系,二者互相补充,不可或缺。本文通过概率模型将二者融合并通过实验证明在概率值α=0.5时,视频分类性能效果达到最佳。