基于改进词袋的多媒体文档检索研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hlp2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络和数字媒体技术的飞速发展,各种信息量每年以惊人的速度递增,文本、图形、图像、声音、视频等不同模态组成的多媒体文档,逐渐取代普通文档成为人们日常接受的信息呈现方式。如何高速有效的管理这些多媒体文档、如何从海量数据中快速准确的检索到用户需要的内容是目前亟待解决的问题。现有的多媒体信息检索方法是利用单一模态进行检索,这种方法具有歧义,难以准确的表达多媒体文档的语义。针对上述问题,本文提出了一种新的构思:将BOW(Bag of Words)向量表示的文本信息与BOF(Bag of Features)向量表示的图像信息进行多模态融合,并对二者采用一定的加权策略对多媒体文档进行检索。并针对传统BOW和BOF在表达文本和图像上的不足,分别对二者进行了改进。其中改进的BOW降低了码数的尺寸,提高了检索效率,而改进后的BOF减少了图像表达的歧义,增强了表达准确性。最后,在基于Lucene的文本检索系统和基于LIRe的图像检索系统上,本文对原始单模态检索、传统BOW和BOF融合的多模态检索、改进后的BOW和BOF融合的多模态检索进行了分析和对比。实验结果表明多模态融合综合考虑了文本和图像的影响,效果要高于单模态的多媒体文档检索。而改进后的BOW和BOF则进一步增加了检索的准确性,提高了检索的效率。
其他文献
WSN是一个分布式的网络,由大量微型化的传感器节点组成,其节点不仅具有无线通信能力,而且还具备计算能力。由于传感器节点具有微小性、广泛分布性等特点,它在节点能量、通信能力
面向服务架构因其很好的适应分布式环境和跨平台等特点,已经被广泛应用于基础软件和大型信息系统的研发。但是由于SOA应用下资源共享程度的不断提升,保障资源安全变的越来越重
近年来随着我国物流行业的迅速发展,人们对物流运送的时效性以及运输车辆的实时跟踪要求越来越高。本文针对这一问题,设计开发了一个物流路径规划与跟踪系统,可以为物流企业车辆
随着信息的爆炸式增长,推荐系统的出现提供了一种有效解决信息过载问题的手段,它能够帮助用户从互联网产生的海量信息中提取有用的信息内容。首先,它通过分析用户在互联网中
随着Web2.0的发展,Twitter、FaceBook等基于社区的社会网络服务得到了广泛的普及,网络用户的数量也取得了快速的增长。与此同时,网络的链接关系也渐趋复杂化,链接挖掘成为了一个
视觉是人类认知世界获取信息的主要途径,使人能够感知复杂、变化的环境。因为人眼摄入图像的整体性和人类视觉神经系统处理信息的高度并行性,人类辨识图像并判断出其感兴趣区
人脸在人类社会的交流中起着重要的信息表达功能,每一张人脸都承载着其独特的个体信息(包括种族、性别、年龄等)。图像则是人脸最常见的信息载体,包含人脸的图像在人类日常社
先进制造系统是综合运用先进制造模式和先进制造技术,由多个工厂和车间组成的多网络、多设备的综合系统。如果出现故障会带来不可估量的损失,因此需要监控系统对先进制造系统中
物联网的发展为智能家居带来了新的机遇。随着国内人民生活水平的提高,智能家居不仅仅是别墅、高档小区的独有之物,越来越多的中低档户型对智能家居的需求日益增加。本文通过对
随着科学技术与生产的发展,自动化系统规模的不断扩大,对设备生产使用的要求越来越高,提高设备的使用效率和工作强度成为设备研究专家的关注领域。然而,设备的功能完善的同时,各部