适用于零售数据量化关联规则挖掘算法研究

被引量 : 1次 | 上传用户:www4006804680com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着零售业的数据日益增多和随着信息技术的飞速发展,商务智能在零售业的应用,已成为信息系统与电子商务管理理论界研究和行业关注的热点。购物篮分析是关联规则挖掘在零售业中的一种有效方法,其目的是在顾客的购买交易中分析出同时购买一类产品或一组产品的可能性,有利于商品的摆放和提高促销效果。最初研究的关联规则是布尔型关联规则,其典型算法有Apriori和FP-growth等。然而零售业的数据库有着丰富的数据类型,如数值型、枚举型等,传统的布尔属性关联规则挖掘算法Apriori已经不再适用,因此要研究量化关联规则挖掘技术。在量化关联规则挖掘中,预处理中的离散化是关键。本论文成功把基于模糊聚类的量化关联规则挖掘算法应用到零售数据中。针对量化关联规则挖掘技术这一研究热点,本论文以购物篮分析为应用背景,以美国零售业数据DMEF(Direct Marking Educational Foundation)为研究对象,重点研究一种适用于零售数据的量化关联规则挖掘算法。本论文完成的工作主要有:首先,本论文在对DMEF的代表性数据进行分析,总结数据具有数据冗余、存在空缺值随机性、非均匀分布等特点。同时,针对关联规则挖掘任务,本论文阐述了量化关联规则挖掘DMEF数据进行了一些必要预处理的步骤,如:数据清理和空缺值填充(详见第三章)。其次,本论文分析了现阶段常用的量化方法及其应用范围,并归纳为三大类,分别为基于等区间划分的离散化方法、基于等频划分的离散化方法和基于聚类的离散化方法。同时,结合DMEF,用实验来证明前两种方法的有效性,分析其优缺点(详见第四章)。最后,本论文结合模糊C-均值算法FCM和经典布尔型关联规则挖掘算法Apriori,提出一种基于模糊聚类的量化关联规则挖掘算法,设计出量化关联规则挖掘的框架设计及步骤,解决零售业中Apriori算法无法使用数值型属性进行关联规则挖掘的问题。利用该算法操作既能体现数据分布特点;能软化属性论域的划分边界,合理化的离散区间;也能有效解决“过小置信度”和“过小支持度”等问题,最终挖掘出更多有价值的关联规则。该算法对零售业的战略决策有一定的指导作用(详见第五章)。
其他文献
在古今中外的园林景观空间中,光影被设计者有意或无意地应用着,它的存在使园林景观更富于美感,使景观空间更具层次感。但长久以来在这方面并没有相关系统的研究,直到近年,随
自20世纪60年代诸多西方发达国家提出“教师专业化”作为教师职业发展的方向以来,教师专业化的发展已经成为全球教师职业发展的重要趋势。在这个大背景下,对教师主体性的研究
神经末梢突触囊泡释放神经递质是一个复杂且受到精细调控的过程 ,涉及多种蛋白质间的相互作用。位于突触囊泡膜上的突触囊泡蛋白 /突触囊泡相关膜蛋白 (synaptobrevin/VAMP)
随着现代化信息时代的来临,三大运营商竞争日趋激烈。三大运营商中,中国电信采用固话+手机+宽带等捆绑政策,大肆抢占移动客户资源,已经对移动客户产生极大的影响力。由于中移动在固
期刊
就业教育最终的目标是要培养大学生的全面素质,提高其就业能力。本文对大学生就业教育的内涵和特点及大学生就业教育现状及必要性进行分析,阐述了大学生就业教育中贯彻人文关
品牌虚拟形象代言,产生已久,其优势越来越凸显,在国外品牌中已运用的相对成熟,但国内大部分企业还没有意识到,即使一些企业采用了虚拟形象代言,也单单将其看作一个形象,没有
消费者的诉求随着社会经济形势的发展而不断地发生着变化。体验经济的到来使得人们现今期望通过个性化的消费来实现自我,这种个性化的消费可以被看作是个人的体验的满足。之
JAKs与STATs广泛参与体内多种重要细胞因子的信号转导,JAKs/STATs信号转导通路的异常活化与肿瘤、免疫相关疾病的病理过程密切相关,已成为新药发现及研究的重要靶点,多个JAKs
IL-3又称多克隆集落刺激因子(Multi-CSF),是造血干细胞增殖分化的正性调节因子。它通过与靶细胞表面的受体结合传递生长、分化信号,调控造血干细胞生存、增殖及向各系血细胞
培养学生的良好习惯非常重要,对他们以后的学习会产生深远的影响。从培养学生的课前预习习惯和课堂学习习惯谈了认识。