论文部分内容阅读
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。粗糙集理论-一种新的数据分析方法-在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。巨大的数据量是降低数据挖掘与知识发现速度和效率的主要因素,在进行数据挖掘的前期,应对数据仓库中的属性进行约简、对数据进行概念提升,尽量减少或消除不重要的属性和数据对数据挖掘速度的影响。
本文从一个实际研究项目出发,阐述数据挖掘相关理论,实现了基于粗糙集的数据挖掘技术在医药销售决策管理中的应用。文章首先介绍了客户关系管理的基本概念和通过数据挖掘进行客户关系管理的意义、决策支持系统的发展和决策推理的结构与方法;然后介绍了数据仓库的基本概念和构成、粗糙集理论的基本概念、利用概念层次进行面向属性归约的方法;最后介绍了系统实现的总体结构、系统的数据仓库设计、进行数据预测的算法和算法的改进、数据转换与归一化处理的方法、系统进行数据挖掘的过程。文中还介绍了系统实现中MATLAB与关系数据库接口问题的解决方案、Visual Basic语言与MATLAB集成的方法,并给出了系统的部分输出图表。
本文的主要研究工作如下:
(1)对预测性的数据均值算法的改进:算法效率的改进,在降低运算量的同时提高预测精度;参数的不同选择可适应数据的不同变化规律,综合考虑历史数据和近期数据对均值预测的影响度。
(2)将改进的均值算法应用于周期性数据的预测方法中,再通过均值误差、数据变化趋势对预测结果进行修正,来提高周期性数据预测结果的准确度。
(3)将粗糙集理论与面向属性归约技术有机结合,计算属性的重要性、差别矩阵,对数据进行概念提升,将粗糙集理论应用于数据挖掘。
(4)在上述分析和研究的基础上,将算法和相关理论应用于医药销售决策支持系统。