基于数据挖掘的数据库索引优化方法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:gf_lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各行业信息技术的不断发展,数据的存储量呈井喷式增长,企业中存放数据的数据库每日需处理的数据量不断增加,而用户对响应时间的要求也越来越高。面对不断提高的数据量,针对不同信息系统底层数据库结构进行整体优化的需求迫在眉睫。在此背景下,本文以DZY信息系统的用户操作数据库日志为基础,利用关联分析方法对数据库日志进行数据挖掘,获取用户操作中存在的具体规则;提供企业系统数据库性能优化决策支持,来提高整体数据库性能。本文具体工作内容如下:本文分析目前数据库发展情况、数据库性能优化现状与数据库日志的研究情况,并结合DZY信息系统的实际情况与业务特点,最终通过关联分析方法对数据库日志进行数据挖掘,并采用可拓学的评价方法对挖掘结果进行评价,得到最优的索引方式来对数据库性能进行优化。本文首先根据MySQL数据库的执行计划、CBO成本计算方式、不同查询算法的结构等对数据库查询算法成本进行核算。分析比较不同查询算法之间的优劣势,根据DZY信息系统的用户实际操作情况最终选择B+树查询算法来对用户查询进行优化,并介绍B+树查询算法的适用场景与不适用场景。针对DZY信息系统数据库日志,建立数据库操作日志数据挖掘模型。将格式化后的数据库日志采用Apriori算法进行关联分析,来获取数据库日志中存在的关联规则。对关联分析得到的关联规则采用可拓学的评价方式来进行评价,其中关联规则的物元模型通过CBO成本核算得到的查询算法计算公式建立,最终比较不同关联规则的优度获取最优的结果,来对DZY信息系统数据库进行性能优化。通过仿真实验比较不建立索引与建立索引用户查询所需时间与插入相同数据量所需时间,验证实验结果的科学性。最后为实现对数据库操作日志数据挖掘的高效分析,将数据库操作日志数据挖掘模型进行可视化设计,实现数据库索引维护系统。该系统实现了数据整合、数据仓储、数据分析、数据展示,使得用户能够更便利地分析数据库操作日志,更简易地维护数据库索引,提供数据库性能优化决策支持。
其他文献
世界正在进入复杂多变的“风险社会”,依靠传统的个人经验、技术手段和组织管理方式已经无法全面预见和应对风险社会的各种不确定危机。充分开发利用民警个人知识与公安组织知
异议股东股份收买请求权制度是保护小股东的最后救济手段,也是异议股东退出公司的有效途径。有限责任公司的人合性与封闭性决定了其股份流动性的相对欠缺,因此这一制度在有限
《侦查主体体系分析》一文从侦查法主体的视角,提出了不同法律制度下侦查主体的差异问题。侦查法主体的性质,关涉到其法律关系是否适合案侦生产力的问题。法主体的权责利,有两方
玫瑰紫誉为珍品蟹壳青称为上品鳝鱼黄贵为佳品砚,也叫砚台,是一种用于研墨,盛放墨汁和掭笔的用具,与笔、墨、纸合称为文房四宝。由于其性质坚固,传百世而不朽,又被历代文人作
近年来人们对脑外伤后继发性损伤的研究越来越深入,继发性损伤主要表现为脑水肿、脑肿胀、脑微循环障碍等。这是一个非常复杂的生物化学过程,各种损伤途径彼此间错综联系、相互
利用MIDAS有限元软件,对上海软土深基坑降水开挖而引起的变形进行数值模拟,本文通过不同的降水情况和改变地连墙入土系数,研究降水情况和地连墙入土系数对圆形深基坑抗隆起稳定
植物表皮蜡质是植物与外界环境的第一接触面,其特有的疏水有机混合物形成一道天然保护层覆盖于植物各个器官和组织表面。表皮蜡质在植物适应各种外界环境变化中发挥着重要作
电力工业是国民经济的基础产业,一个国家电力工业的发展水平直接决定着其经济的发展水平。本文分析了我国目前的能源结构和火电、水电、风电等发电形式的工作原理和优缺点;研