论文部分内容阅读
本文以提高联机分析处理系统的可靠性和查询速度为目的,在对数据仓库与联机分析处理及分布式计算相关技术进行深入研究和分析的基础上,结合房地产分析系统的实际,设计并初步实现了一个分布式多维分析系统的试验模型。本文的研究工作主要体现在以下方面:
首先,介绍了数据仓库的定义及其特征,重点分析了目前主要的数据仓库体系结构的优缺点,并在此基础上给出了本文采用的数据仓库的结构。此外,还介绍了联机分析处理的概念及其分类以及什么是多维表达式。
其次,分析了具有主服务器的联机分析处理系统的不足。设计了具有可竞选主服务器机制的分布式联机分析处理系统。设计并优化了客户和多服务器直接通信的分布式联机分析处理系统。
再次,对用户提交的查询任务的可拆分问题进行了研究,重点放在了对单一子任务的可拆分性的判断上。提出了一个“小负载大任务”算法,用于将拆分后的子任务分配给系统中的服务器去执行,文中给出了该算法的C++语言实现,并结合具体实例进行了说明。对子任务的查询结果进行合成的问题也在文中得到了说明。
再其次,对当前分布式系统中广泛采用的通信模型的优缺点进行了分析,并在此基础上建立了系统所采用的进程间通信机制。
最后,对客户和服务器的实现方案进行了设计,实现了一个分布式多维分析系统的试验模型。并且在该模型的基础上进行了试验,对试验结果做了分析。总结了系统各方面的性能,分析了存在的问题,为进一步的研究提供了方向。