论文部分内容阅读
当今已经进入了云计算时代,其中,数据的分布式存储和查询也已成为大数据管理的关键技术之一.分布式数据管理在数据存储层面需要进行数据的分片和配置,在查询方面需要进行各节点查询子结果的配置与整合.对于结构化数据例如关系型数据已经具有了成熟有效的相关技术,但对于主要是半结构化、无结构化以及多种数据模式混杂的大数据而言,其分布式数据分片和配置还是一个具有需要深入研究的课题.本文针对具有广泛应用的具有时间标签的非结构化数据,提出了一种按照时间标签进行分片与配置的分布式存储与处理方案,相应的仿真实验表明本文的工作是可行的和有效的.