论文部分内容阅读
随着科技的发展,数据量呈现出了爆炸式的增长方式,数据类型也由一维结构化数据发展为高维非结构化数据,这给传统的数据存储与检索方式带来了巨大的挑战。其中,空间数据在越来越多的领域得到了广泛的应用,比如城市规划与管理、气象监控、空间遥感信息图像处理等。但空间数据有其自身的复杂性,且空间数据的应用领域数据量通常都非常大,使用传统的C/S模式来存储和检索需要付出高昂的代价。而且空间数据这些应用领域通常需要执行大量的并发操作,但C/S模式对并发操作的支持有限。而P2P拓扑动态易于扩展,基于分布式支持高并发操作,面向应用,软件易于开发,非常适用于空间数据的应用领域。P2P作为一种成熟的基于分布式计算的点对点通信技术,已经证明了它能替代传统的C/S模式。在P2P模式下对复杂而庞大的空间数据进行存储和检索,是一种高效而代价低廉的方法。另外,将P2P模式应用于数据的存储与检索早就得到了证明。传统的P2P空间数据存储与检索方法——降维后存储和空间填充技术(或称空间分割技术),均有无法逾越的缺陷,降维破坏了原数据的空间特性,无法进行范围查询;空间填充技术虽然保持了数据的空间特性,但引入了空间分割算法,操作复杂且可扩展性差。理想的P2P空间数据存储与检索方法应该是能保留原数据的空间信息、支持范围查询、操作简单、具有自组织和容错性、可扩展性等特性,而树形结构有很多特征与上述要求吻合,比如自组织、可扩展性强、易于设计范围查询算法等。因此本文在充分参考了现有的各种P2P路由算法的基础上,提出了一种基于Baton树的空间数据存储与检索结构——HD-Baton树,将树形结构应用于空间数据的存储与查询。主要研究工作及成果如下:①基于Baton树做出结构改进,设计适用于空间数据存储与检索的HD-Baton树结构。②针对HD-Baton树的结构,参考Baton树原有的一维数据检索算法,设计适用于空间数据精确匹配检索和范围检索的算法。③对于树形结构可以增加孩子结点来加速逼近的特点,通过增加孩子结点的数量使查询时间复杂度由O(log N)降为O(logmN)。最后,在.Net平台和SQLServer2008等软件的辅助下完成实验,证明本文理论的可行性和准确性。