论文部分内容阅读
随着各行业信息技术的不断发展,数据的存储量呈井喷式增长,企业中存放数据的数据库每日需处理的数据量不断增加,而用户对响应时间的要求也越来越高。面对不断提高的数据量,针对不同信息系统底层数据库结构进行整体优化的需求迫在眉睫。在此背景下,本文以DZY信息系统的用户操作数据库日志为基础,利用关联分析方法对数据库日志进行数据挖掘,获取用户操作中存在的具体规则;提供企业系统数据库性能优化决策支持,来提高整体数据库性能。本文具体工作内容如下:本文分析目前数据库发展情况、数据库性能优化现状与数据库日志的研究情况,并结合DZY信息系统的实际情况与业务特点,最终通过关联分析方法对数据库日志进行数据挖掘,并采用可拓学的评价方法对挖掘结果进行评价,得到最优的索引方式来对数据库性能进行优化。本文首先根据MySQL数据库的执行计划、CBO成本计算方式、不同查询算法的结构等对数据库查询算法成本进行核算。分析比较不同查询算法之间的优劣势,根据DZY信息系统的用户实际操作情况最终选择B+树查询算法来对用户查询进行优化,并介绍B+树查询算法的适用场景与不适用场景。针对DZY信息系统数据库日志,建立数据库操作日志数据挖掘模型。将格式化后的数据库日志采用Apriori算法进行关联分析,来获取数据库日志中存在的关联规则。对关联分析得到的关联规则采用可拓学的评价方式来进行评价,其中关联规则的物元模型通过CBO成本核算得到的查询算法计算公式建立,最终比较不同关联规则的优度获取最优的结果,来对DZY信息系统数据库进行性能优化。通过仿真实验比较不建立索引与建立索引用户查询所需时间与插入相同数据量所需时间,验证实验结果的科学性。最后为实现对数据库操作日志数据挖掘的高效分析,将数据库操作日志数据挖掘模型进行可视化设计,实现数据库索引维护系统。该系统实现了数据整合、数据仓储、数据分析、数据展示,使得用户能够更便利地分析数据库操作日志,更简易地维护数据库索引,提供数据库性能优化决策支持。