论文部分内容阅读
随着互联网Web2.0技术的发展和数据量的快速增长,如何高效地存储、处理和提取海量数据成为一个亟待解决的问题,云计算技术在这种背景下应运而生。应用领域的不断发展和演变使数据存储和管理方式发生变化,出现了很多新的数据管理技术。随着云计算技术的兴起,尤其是传统的关系型数据库面临“存储和管理大数据”、“高可用性”和“高伸缩性”等各种压力和挑战下,云数据管理技术成为及其热门的研究领域。在现有数据管理技术的基础上,充分考虑云计算的需求和特点,研究并开发适用于云计算环境的数据管理系统是一个非常重要的研究课题,具有重大的理论意义和实践意义。NoSQL系统作为云数据管理技术的一个有效的解决方案,以高可用性、高伸缩性、支持海量数据为目标,在云计算领域被广泛应用。本文以NoSQL系统的典型代表MongoDB数据库为例进行研究,主要的研究内容如下:本文首先从云计算的概念和特点入手,分析了云计算技术的发展给数据管理技术带来的挑战。介绍了云计算环境下NoSQL系统的概念、特征和理论基础,分析主流NoSQL系统的设计原理和特征,并将NoSQL系统与传统的关系型数据库在数据模式、系统架构、读写特性、可扩展性等多个方面进行了详细的分析比较。通过分析对比得出结论:对于云计算环境中的海量数据存储和处理等问题,NoSQL系统是优于传统关系型数据库的解决方案。然后以MongoDB数据库为例,分析其高扩展性集群的架构及原理。深入研究了自动分片集群所使用的均衡算法,针对其数据均衡算法存在的问题,提出了一种改进的数据均衡算法——基于数据操作频率的均衡算法,并通过实验验证了算法的有效性,改进的算法提高了自动分片集群的并发读写性能。最后针对现有数字资源管理系统存在的问题,分析了MongoDB数据库建模的可行性,设计并实现了一个基于MongoDB的高可靠、高扩展的数字资源管理系统。MongoDB的高扩展性为系统的扩展提供便利,为系统迁移到云计算环境奠定了基础。