论文部分内容阅读
数据挖掘是近年来企业实现商业智能的核心技术,它是知识发现过程中的关键步骤,得到了学术界的广泛关注。如何提高数据挖掘的效率成为学术界热门的研究课题。针对这一状况,作者对现有的数据挖掘系统结构进行了分析,提出了一种新的数据挖掘体系结构。即在原有的数据挖掘体系结构中增加一个模式库管理系统,该系统有三个主要的功能部件:模式库——用于存储数据挖掘得到的模式(如:关联规则、分类规则和序列模式等等);模式库管理系统——负责对模式库进行管理,通过这个子系统用户可以对模式库进行各种操作和管理;监视器——提供自动触发机制,负责自动检测信息源中数据的变化并把这些变化上报给模式库管理系统,以便通过模式库管理系统启动挖掘模块重新进行数据挖掘来实现模式的自动更新,为模式时效性问题的解决提供了一种方法。通过增加这样一个新的系统就为数据挖掘结果的共享及数据挖掘效率的提高提供了一种新的途径。为使数据挖掘结果能统一存储在模式库中,作者对关联规则、分类规则和序列模式挖掘结果的存储方法进行了深入的研究,提出了数据挖掘结果模式的存储方法,并用关系代数进行了描述,在关系数据库中实现了多种数据挖掘结果模式的统一存储。由于关系数据库的广泛使用,这种改进的存储方法为不同系统间共享数据挖掘结果提供了统一的平台。在此基础上,作者对数据挖掘结果的操作进行了研究,提出了结构化的模式查询语言SPQL(Structured Pattern Query Language)。利用SPQL语言的语句可以实现对数据挖掘结果的管理和查询。作者在论文中给出了SPQL语句在关系数据库中的实现方法,即通过SQL语句来解释SPQL语句。有了这种查询语言就可以很方便地操作模式库中存储的各种数据挖掘结果,为管理和共享数据挖掘结果提供了一种有效手段。作者将此数据挖掘结果的存储方法和部分SPQL语句应用于“重庆市医药股份有限公司综合管理系统”中,开发出了一套实验系统,从而验证了数据挖掘结果存储方法的可行性和正确性。