论文部分内容阅读
随着近年来海量数据的积累以及竞争的加剧,及时快速的从这些庞大的数据中抽取出决策者所需的信息,为企业获得更高的经济效益使得数据挖掘的应用越来越受到企业界的重视。而基于数据挖掘技术支撑的商业智能也因其能够及时正确的帮助企业经营者做出决策,协助企业顺利解决问题而变的越来越重要。关联规则挖掘在数据挖掘技术中应用较为广泛,Apriori算法是其经典算法。但它默认的前提是事务数据库中的所有项在挖掘的过程中是等价值的,但在现实中,不同的项也就是不同的商品往往重要性也不同,换句话说就是不同的商品给商家带来的利润不一样。基于此,本文从利润的角度进行分析,应用数据挖掘方法来帮助企业提升利润。本文首先介绍了商业智能的概念,数据挖掘技术以及数据挖掘工具的选择。其次详细介绍了关联规则挖掘技术,针对传统的关联规则挖掘算法的不足,提出了基于利润对不同商品项进行加权的思想。在进行关联规则挖掘前,应用该权重信息对原始交易数据进行数据预处理,从而降低了挖掘的规模,提高了挖掘的效率。对于加权后的Apriori算法中支持度和置信度的运算不再适用的情况,给出基于利润加权关联规则中的加权支持度和加权置信度的定义。根据加权思想对原Apriori算法进行改进得到基于利润加权的布尔关联规则挖掘算法,记为LRJQ算法。通过实验将两种算法进行比较,证明了该算法的有效性。最后借助SQL SERVER 2005的商业智能平台,将LRJQ算法应用到商品交叉销售系统中,其中首先进行系统的维度设计,并通过SSIS进行数据抽取、转换和加载,将符合关联挖掘的交易记录抽取到数据仓库数据库中。然后通过SSAS进行LRJQ算法插件的编写,完成挖掘模型的构建,最后对挖掘结果进行展示。根据挖掘结果可以为超市的布局提供合理的依据,提高商家的销售效益。