论文部分内容阅读
在电子商务蓬勃发展的今天,电子商务企业显示了其优越性和旺盛的生命力。网上购物,在线交易,网上中介等等,无一不在改变我们的生活。随着电子商务企业间竞争的加剧,在其运营过程中,通过对其客户的注册和交易信息进行分析,从而预测客户行为,发现重点客户,制定企业的决策计划,对提高企业的竞争力,显得尤为重要。作为统计学的一个分支,聚类分析是在无先验知识无指导下把数据划分为有意义或有用的簇,是数据挖掘中的一种技术。通过合适聚类算法的选取,进行数据分析,发掘潜藏有价值的信息,聚类分析是企业在其数据处理中强有力的工具。CLIQUE作为一种基于网格的算法。可以对高维数据进行全面聚类和子空间聚类,并且有着良好的可伸缩性和数据处理能力,比较适合电子商务客户的聚类划分。但是由于它只是进行了一种硬性的网格划分,增加了时间复杂度,本文通过比较,在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法,并使用仿真数据加以验证,结果表明,改进算法对大规模数据集有着很好的聚类效果。在把技术应用实践的方面,本文收集了中国广告网的数据作为案例,分析了算法在此具体实例中的应用效果,即对客户数据进行聚类,然后通过关联规则算法得出类中有价值的规律,从而供企业的决策者利用这些规律,制订企业的管理、营销策略。