多维空间数据库NN检索的并行处理方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:sufaya0505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文中采用了Roger Weber提出的VA-file的索引结构,其在高维环境下的检索效率比R树系列和X树等索引结构都高出了许多,特别是针对复杂的最邻近检索和相似性检索.最邻近检索和相似性检索(NN检索)在多维空间数据库中有十分重要的应用,如GIS、CAD、多媒体数据、生物基因研究等领域.然而,实现多维的空间数据库及各种多维的检索却存在许多困难.并且由于多维空间数据的检索与传统的关系模型数据库有很大不同,通常的低维索引和检索基于这样一个假设:数据多在二级存储器上,检索代价是I/O相关的而不是CPU相关的.然而,这个假设在多维的空间数据库管理中并不总是正确的,某些针对复杂对象的操作,(例如我们所涉及的NN检索),会占用大量CPU的时间,从而改变与I/O的平衡<[1]>.因此,多维检索的效率不再主要决定于磁盘I/O的次数.正是基于解决多维空间的最邻近检索的复杂性,该文在详细分析多维空间检索方法和一般并行检索方法的基础上,采用VA-file<[2]>多维空间索引结构,结合具体的NN检索,从理论上引入一种基于VA-file的NN检索的并行算法,采用前端处理器进行调度,通过轮转法分配数据给后端处理器的方法并行运算.相对于VA-file的检索算法,并行处理增加的复杂性和时间开销集中于通信网络的平均负载和前端处理机的控制代价,通过对其性能进行分析,结论是在数据量很大的情况下,通信网络的负载加上前端处理机的控制代价,要小于每个处理器的平均处理时间.因此,一个合适的处理器数目所带来的效率提高是准线性的.VA-file索引结构在多维空间数据库中有着广泛的发展前景,而并行计算可以解决多维检索的复杂性.
其他文献
在互联网上每天都有大量的数据产生,对于这些拥有不同特性的数据,该如何建立一种算法来解决聚类问题呢?依据这个问题我们提出的基于群进化策略模型的模糊聚类算法,该算法可以在聚
随着网络技术的发展和用户要求的不断提高,不受时间、空间限制B/S结构的网上选课系统取代原有的C/S结构的选课系统已成为一种趋势。本文首先简要介绍了面向对象的系统开发平台J2
系统BIOS技术是直接操作计算机硬件设备的底层核心技术。合理裁减系统BIOS,加快系统BIOS启动速度,对满足某些时间约束苛刻的嵌入式应用将具有重要的作用和意义。 本文结合横
随着网络信息的急增,信息检索工具将扮演着越发重要的角色.借助于信息检索工具,人们可以快速、准确地查找到所需的信息.查全率和查准率是衡量信息检索工具的重要标准,目前基
我国移动通信的发展已经步入一个高速增长的时期,短消息作为GSM系统中最为简单和方便的数据通信方式,其业务和应用正得到非常迅猛的发展。无论是通信设备制造厂商、ICP,还是电信
无线传感器网络能够实时的感知复杂区域的环境状态,以自组织的网络形式将采集的数据发送给汇聚节点。近些年来,无线传感器网络技术快速的发展使得无线传感器网络得到广泛应用。
随着大数据的发展,大量的开源数据在网上公布。另外,还有大量的有偿使用数据被当作商品进行交易。然而,这些数据中存在很多的质量问题,如不完整性、不一致性、不正确性等,这些问题
随着计算机技术的飞速发展,并行计算的应用领域也越来越广。并行计算机从以前的大型专用向量机,发展到并行多处理器系统,以及现在比较流行的工作站机群系统。并行程序设计方式也
学位
万维网(WWW)目前是一个巨大的、分布广泛的全球信息服务中心,它涉及到新闻、财经、广告、商务、文化、教育等信息服务。然而面对复杂而庞大的万维网,多数用户感到力不从心。