论文部分内容阅读
传统的决策支持系统是基于数据库和模型库的,由于数据库只能对原始数据进行一般的加工和汇总,致使决策所需信息不足,而模型库很难适应决策本身的动态性和复杂性,两库被独立的设计,缺乏内在的统一性。随着计算机技术的不断发展,以数据仓库为基础、以联机分析处理和数据挖掘为手段的新决策支持系统,现已成为发展趋势。针对新决策支持系统架构,本文以零售企业销售预测为切入点,重点研究数据仓库的构建、多维数据集和联机分析处理以及用于销售预测的数据挖掘算法,并对提出的算法进行测试,开发了三层C/S模式的零售企业销售预测决策支持系统。主要研究内容和结论如下:(1)针对企业信息化建设和市场竞争的需要,在分析传统决策支持系统不足的基础上,提出了基于数据仓库和数据挖掘的新决策支持系统体系架构,并对新决策支持系统进行了分析。(2)为了将分布在企业网络中不同站点的商业数据集成到一起,使企业的业务操作环境和信息分析环境分离,根据需求分析,构建了以销售预测为决策主题的数据仓库,确定逻辑模型并建立了相应的事实表和维表,在SQL Server 2000中创建数据仓库的物理模型,设计了实现数据提取、转换、加载和自动更新的DTS包。从而有效地为决策者提供了各种类型的、充分可靠的数据基础。(3)为了对数据仓库中的数据进行有效分析,帮助企业掌握运营情况,了解市场需求,建立了面向分析的多维数据集,并用联机分析处理对多维数据集中的数据用切片、切块、钻取和旋转等方式进行分析,用MDX多维查询语言对多维数据集中的数据进行复杂查询,从中发现有用信息。并提出了对OLAP分析数据展现的三种解决方案。(4)为了利用数据挖掘技术对销售量、销售利润进行分析来预测将来的发展趋势,针对销售预测的特点,提出了用线性回归分析方法进行预测,在研究多元线性回归分析方法及其建模的基础上,提出了建立影响商品销售量的因素(销售时间、商品种类、商品价格、顾客购买力)与销售量之间的四元线性回归模型,并用FoodMart连锁企业的销售数据进行验证,得出平均绝对百分比误差为66.77%,预测效果较差。(5)针对回归分析方法只是用静止的观点描述各经济变量之间的因果关系,没有考虑现实经济活动的动态发展的不足,提出了用时间序列中的AR模型进行预测。分析了AR模型的建模步骤,研究并建立了AR销售预测模型,验证结果表明:AR模型平均绝对百分比误差为18.3%,为良好预测模型,可以用来进行销售预测。(6)针对线性回归和AR模型都是采用线性统计分析的缺陷,提出了采用BP神经网络来进行数据挖掘的销售预测。在研究BP网络的基础上,提出了用于销售预测的网络模型结构,网络的输入为影响某类商品销售的销售时间、商品价格、顾客购买力、AR模型中的时间序列,输出为不同地点某类商品的销售量,建立三层网络结构,利用自适应学习速率和附加动量法对网络进行训练,通过实验确定了预测精度较高的历史数据长度。运行分析后得出平均绝对百分比误差为15.13%,预测精度较AR模型高。(7)基于数据仓库、数据挖掘、联机分析处理技术研究的基础上,采用模块化设计方法,开发了三层C/S模式的零售企业销售预测决策支持系统。系统能够实现数据仓库管理,多维数据集管理,OLAP多维综合分析和基于时间序列AR模型和BP网络算法的销售量、销售利润预测;建立的AR模型和BP网络预测模型,能实现模型的再学习和训练,具有较好的实用性和可扩展性。用FoodMart连锁企业的销售数据进行了验证,系统能够帮助企业制定科学合理的销售决策计划,具有一定的实用价值。