数据仓库和数据挖掘技术在商业智能中的研究及应用

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:jmzhao8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,企业的信息管理系统保存了包括生产运作、销售、客户和产品等方面的大量数据。由于传统的信息系统缺乏有效的分析方法和技术,这些数据被深埋在各自系统设备中,企业处在“数据多、信息少”的尴尬境地。20世纪后期,商业智能((Business Intelligence)应运而生,它主要运用数据仓库(Data Warehouse)、联机分析处理(OLAP)和数据挖掘技术(DM)这三大核心技术处理和分析商业数据,辅助用户解决商务活动中遇到的不确定性问题,从而帮助和改善管理决策以提高其生存能力。商业智能在20世纪90年代有了突飞猛进的发展。近年来商业智能研究的热点主要集中在支撑技术、体系架构和应用系统三个方面,本文主要在支撑技术和应用这两个方面做了研究。  传统的事务处理型数据库技术已经无法满足现代企业复杂的商业信息处理和分析需求,1991年,W.H.Inmon首次提出数据仓库的概念。本文首先研究了数据仓库的基本原理及其与商业智能的关系,并基于SQL Server2008 BI平台创建了以销售和库存为主题的数据仓库。传统的联机事务查询已经无法满足企业决策人员的多维复杂查询需求,本文在销售库存数据仓库中,构建了销售库存多维数据集,在SQL Server2008 BI平台实现了企业级的多维度、多层次的OLAP技术。  数据挖掘技术可以从商业数据中发现新的商业模式,为企业提供决策和预测支持。对于直接营销(Direct marketing)商业问题,针对连锁型零售企业的客户多、门店多和客户购买行为随机分散的特点,本文利用原型挖掘模型选择理论提出了EM聚类朴素贝叶斯分类模型,采用先聚类再分类的基本思想,解决了单一挖掘模型因为没有足够数量的客户购买事件数据而影响和降低挖掘模型分类精确度的问题。实验证明,EM聚类朴素贝叶斯分类模型在客户购买行为分类预测方面明显优于K-means聚类朴素贝叶斯分类模型和无聚类的朴素贝叶斯分类模型。  OLAM(On-Line Analytical Processing Mining)是研究如何将OLAP和数据挖掘有机结合、优势互补的热点技术。本文利用在数据仓库中构建的销售库存数据立方体作为数据源,提出了基于OLAM的EM聚类关联挖掘模型。该模型利用OLAM可以在不同维度和不同粒度上实现数据挖掘的优势,针对交叉销售(Cross selling)问题,先用客户维度信息提取客户的人口统计特征聚类模式,再把客户聚类模式信息作为新的分析维度引入到维间关联规则挖掘中,实现了聚类和关联规则两种挖掘算法与OLAP的有机融合。最后在SSAS数据挖掘工具实现了该OLAM模型,并得到了每个门店的交叉销售方案。实验证明,该OLAM EM聚类关联挖掘模型具有更好的灵活性和有效性。
其他文献
基于位置服务的技术近年来发展迅速,然而在一些特殊环境下的定位系统仍不够成熟,例如在矿井、室内、地下室等场合中,GPS和移动通信方式定位很难满足需求。本文在对国内外的无
随着应用软件系统复杂程度的不断提高,同时,一些分布应用业务逐步增加,致使软件开发逐渐朝着分布式方向发展,在分布式软件系统发展过程中,人们逐渐将分布式技术与组件技术相结合,组
数据合并现象常出现在现实生活中,如:若干企业合并成新的企业,不同植物嫁接成新的植物,两个天体吸引成大的天体,多条河流汇合成大的河流等均展示了若干数据向另一数据的合并
由于广泛支持包括视频点播、实时电话会议等多种视频应用服务,基于H.264编码标准的应用产品变得越来越流行,但由于其在设计之初并未考虑安全应用问题,因此如何确保H.264应用的安
信息资源的检索,不仅包括检索部分,还包括数据的收集、预处理、结构组织、存储、数据检索的表示以及数据与查询之间相关度的计算等。据此,本文针对人脸图像信息及文本信息资
近年来,网络上的信息传播正在逐步取代传统媒体,互联网上以音视频为代表的多媒体信息迅速增长,同时由网络音视频引发的信息安全问题也日益突显。不法分子在网络上大量传播淫秽色
互联网像星星之火一样飞速发展,用户以及其产生的信息呈爆炸式增长。而今,利用电子商务平台购物也越来越普通,逐渐也成为人们购物方式重要选择之一。但是网络购物方式为人们
无线传感器网络中,节点相互协作、自主运行,通常布置在偏僻地区、野外或者敌方战场等人员难以到达或不能到达的恶劣环境,而传感器节点一般由电池供电,其能量十分有限。很显然,通过
在自然界和工程实践中,经常遇到许多非平稳信号,譬如:语音、生物医学信号、雷达和声纳信号等。单纯的时域或频域的分析方法已经达不到工程上实践的要求,而时频分析方法的发展为非
随着我国民航业的不断发展,机场航空噪声对周围环境的影响越来越严重,为准确了解机场附近噪声污染状况,机场噪声监测处理系统的建立越来越重要,而机场噪声监测点的分布成为了实现