论文部分内容阅读
稀疏矩阵的应用领域广泛,典型的如网络分析、图论、解微分方程、社会关系分析、线性规划等领域。传统用于存储大型稀疏矩阵的通用存储结构主要有两种——行压缩存储格式CRS (Compressed Row Storage)和列压缩存储格式CCS (Compressed Column Storage)。CRS和CCS均有效实现了数据的压缩存储,其中行压缩存储是按整行来存储非零元素,行压缩存储使用行索引来实现对行的查询;列压缩存储是按整列来存储非零元素,且列压缩存储使用列索引来对列的元素查询。本文从多维数据角度重新审视稀疏矩阵大数据存储,提出了基于UB树的稀疏矩阵存储结构。本文主要工作点主要包括:①稀疏矩阵的UB树存储机制研究,包括稀疏矩阵的Z-order降维,B+树分裂与Z-region演化过程研究。②提出基于UB树的稀疏矩阵的查询算法与各类运算算法。查询算法主要实现矩阵的非零元素查询,矩阵运算算法本文只是做了简单实现,分别有矩阵加法运算、乘法运算、转置运算。③对UB树范围查询算法进行了改进。本文在研究范围查询算法时针对UB树范围查询算法的某处的性能瓶颈,提出了一种新的范围查询算法。④最后与行压缩存储进行了比较测试,测试内容有存储性能、元素查询性能、子矩阵查询性能以及改进后的范围查询算法与原算法的性能比较。