论文部分内容阅读
随着我国经济建设的不断发展,信息化建设脚步也在日益加快,这使得企业文档处理模式也随之发生变化。因为大规模的传统文档处理工作使得工作人员难以负担,又为了响应国家信息化建设的号召,所以,文档管理系统应时代要求,在当今的信息化社会挑起大梁,占据着不可取代的重要地位。信息的发展、文档信息庞大、网上阅览这三者的结合便导致了各用户海量数据的存储问题。这些大数据的产生给存储、分析、存档带来了新的挑战,首先,传统的关系型数据库难以负荷频繁的数据库读写操作带来的压力,这也时常会造成服务器瘫痪。其次,由于文档信息多样化,造成入库的数据信息向着稀疏的方向发展,这使得预定好的模式和利用关系型引用的传统数据管理技术就受到了挑战。在探索海量数据和半结构化数据相关问题的过程中,诞生了一系列新型数据库产品,其中包括列族数据库、键/值数据库和文档数据库,这些数据库统称为NoSQL[1]。本文从NoSQL的基本概念、四类基本数据模型、与关系型数据库相比的优势和不足、数据安全性和一致性等方面对NoSQL进行了概述。将MongoDB作为NoSQL数据库技术代表,对MongoDB的存储机制、分布式架构进行重点研究。本文使用SQL数据库与NoSQL数据库MongoDB并存于同一个系统,并对两种数据库在数据存储、查询以及修改方面的不同之处进行了分析。本文的主要研究内容以及成果有:MongoDB分布式扩展技术:主要包括复制与分片技术,针对集群架构中的不足提出片键选择策略以及数据负载均衡优化方案;MongoDB内部存储机制:主要包括数据存储模型、GridFS文件存储规范以及内存文件映射机制,并针对存储机制存在的问题提出了存储机制优化方案以及反范式和范式设计并存的设计方案;文档管理系统的应用:利用MongoDB设计存储文档内容的文档数据库模型,在.net的架构下,MongoDB与SQL Server2008协同合作,完成对文档管理系统中信息的管理工作。