多媒体数据库高维数据索引研究及应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jxsdvc6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的迅速发展,人们可以访问到的视频数据急剧增长,如何从这些海量的数据中寻找感兴趣的内容成为一个非常重要的研究课题。通常,人们利用特征提取算法从多媒体数据对象中提取出特征矢量,然后利用特征矢量之间的距离表示多媒体对象之间相似度,从而利用相似性检索,通过计算查询矢量与数据库中矢量之间的距离找出满足条件的对象。由于这些特征矢量通常维数较高,且当数据库中矢量很多时,简单的顺序扫描搜索将导致极大的查询代价,无法满足用户需求。为了提高查询效率,就必须借助于高效的、适合高维数据的索引结构。   近几十年中,人们提出了很多高维数据索引结构,如R-Tree、M-Tree及其变种等。这些索引结构在维数升高时性能会急剧下降,即产生所谓的“维灾”。另外,目前的很多索引结构都是适用于维数一定的数据,当多媒体系统中同时存在不同维度的特征矢量时,其查询性能也受到影响。   本文对现有的索引结构进行了研究。已有的NB-Tree(Norm B+-Tree)方法通过计算特征矢量与参考点的距离将高维特征矢量映射到一维距离空间,采用大型数据库系统所支持的B+-tree进行索引,通用性强且易于维护。但NB-Tree未考虑数据分布情况,使得相似查询的候选结果集中存在很多脏数据,增加了不必要的距离计算次数。结合已有的NB-Tree改进方法,本文从数据分布的角度出发,改进出INNB-Tree(Improved New NB-tree)。INNB-Tree采用主成分析原理选择landmark点的方法来选择参考点,增大了一维距离值之间的差异,从而减少了相似查询时需要比较的数据量。同时,结合特征矢量间的偏移角,剔除了由空间位置不相关产生的脏数据,减少了距离计算次数。对比实验结果表明,该方法性能较好。   最后,从应用的角度出发,结合道路视频导航系统,利用INNB-Tree建立索引,提高检索效率,证明了该索引结构在实际应用中具有可行性。
其他文献
视频取证是当前计算机取证领域的一个研究热点,涉及到计算机取证、人工智能、计算机图形图像、模式识别等多个研究领域。当前,视频取证的研究主要集中在智能视频监控方面,而忽略
学位
随着数据库技术的发展和应用,社会各个部门积累了大量的数据资料,数据挖掘是发现这些数据背后蕴涵的知识的重要手段。但是这些数据信息每天都在不断增加,如果在每次数据库更新之
学位
集装箱运输是现代最重要的运输方式,而集装箱港口是这个运输过程中重要的一个环节,集装箱港口的工作效率影响着整个运输效率。本文研究的是港口多种装卸设备的联合调度问题。虽
分子动力学模拟是一种分子模拟的方法,这种方法主要依靠牛顿力学原理来模拟分子体系的运动,用于研究分子的特性,广泛地被应用于药物设计、研究高分子聚合物材料、生物化学等
学位
利用煤矿瓦斯监测系统采集的大量矿井下瓦斯浓度等监测数据分析煤矿瓦斯涌出规律是一个重要且具有挑战性的学术研究领域。发现煤矿瓦斯时间序列中蕴藏的规律,有利于掌握瓦斯
异常处理机制是面向对象语言普遍支持的提高软件可靠性的方法。作为两款被广泛使用的面向对象语言,C++和Java语言都支持异常处理机制。异常处理机制通常由编译器和异常处理机
学位
带硬约束的MAX—SAT问题又称为Partial MAX—SAT问题,它是SAT问题和MAX—SAT问题的结合,比后两者有着更强的描述问题的能力和更广泛的应用背景。人工智能、电路设计、生物信息
随着数字图像技术的发展,数字图像处理在岩体工程中得到了广泛的应用。在岩体工程中,岩石节理裂隙的几何特征是一个非常重要的性质。提取岩石图像中的各种节理裂隙,了解节理裂隙
学位
近年来,以Internet为代表的信息网络给人们的生活带来了巨大的变化。通过Internet上网已经成为人们生活中不可缺少的一部分,而且现在人们还要求在移动中获得Internet服务。为此
学位