论文部分内容阅读
该文以数据仓库、联机分析处理和数据挖掘技术为研究背景,从提高数据仓库和OLAP系统性能的角度出发,研究了实物化视图技术.以数据的展现为要求,设计与实现了OLAP多维分析中的数据的展现,并运用可视化技术设计与实现了数据挖掘中决策树的可视化.实物化视图技术是一种常用和有效的提高数据仓库中数据访问速度的技术,该文综合阐述了实物化视图技术的目的和分类,介绍了能描述数据立方体视图间依赖关系的依赖格,通过这种依赖格可用静态选择算法进行实物化视图选择.还介绍了静态实物化视图选择算法中著名的贪心算法,通过分析该算法复杂度高的原因,综合考虑各种因素,对算法进行了改进,提出了一种新的收益模型.该文还讨论了视图集的化简技术,通过与实际的查询集相关联,大大减少视图选择算法中需要计算的视图的个数,降低了算法的复杂度,提高算法的性能.另外综合运用提到的技术,提出了一种数据仓库系统中实物化视图系统的框架设计.复杂的数据立方体在展现上缺乏直观性,尤其当维度超出三维后,数据的表示就比较困难.该文提出了一种多维数据用二维表格形式展现的方法,将数据立方体中的维都划分到行维或列维两种维度中去,在二维表格的固定行和固定列中用树型结构体现维的层次结构和层次关系,在行维和列维交织成的二维表格中显示相应的度量数据,实现以二维表格反映多维特征,提供数据立方体的可视化表示,并在此之上进行多维分析操作.此方法并不在程序中保存一个树型的结构,而是通过对树型固定行对象和树型固定列对象中相邻单元格的层号和可见属性的计算,设置相应的可见属性,再通过单元格自身的绘制方法来画出树型结构,这种方法具有复杂度低,运算量小等优点.此外在考虑大数据量时,查询性能可能产生的问题,采用动态填充技术,在不影响用户观察数据的情况下,大大提高了数据查询速度,使用户能直观、快速的得到数据.数据挖掘中决策树是一种重要的技术,可以用于分析数据和做出预测.该文介绍了一种树的画法,通过能反映树结构的二维数组,按从下向上,从左至右的顺序对树进行遍历,在遍历的过程中进行结点的水平调整,亲兄弟与父结点间位置的调整,最后画出一棵符合美观要求的树,此算法结构简单、复杂度低.在此基础上,采用可视化技术中的各种方法,添加能反映决策树中各种信息的表示,将决策的知识可视化的展现在用户面前,能够很好地帮助用户理解采掘出来的知识.