论文部分内容阅读
伴随着互联网和云计算技术的飞速发展,国民经济各行各业涉及的数据量急剧增加,特别是积累了大量的诸如网络交易数据、用户评论数据以及多媒体数据等海量高维数据。有效的海量高维数据索引结构能够提高大数据环境下高维数据查询处理的性能。因此,首先提出了一种大数据环境下基于可变网格的二级高维数据索引结构,全局索引维护数据空间中所有子空间的位置关系信息,局部索引通过在每个子空间上构建M树管理自身的数据;其次,提出了基于二级索引结构的相似查询处理算法,包括点查询和范围查询,查询时通过全局索引快速定位与查询相关的局部索引节点并