基于用户聚类和特征选择的在线购买行为预测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangpeng532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,网上购物已经成为了人们日常生活不可或缺的一个部分。在网上购物的情境下,买家和卖家不再需要进行面对面的交易,这给卖家直观的掌握顾客的需求和反馈提供了一定的障碍。但在另一方面,网上购物为数据分析提供了便利。顾客在网上发生的所有购物行为都被计算机记录在案,这使得商家能够通过这些数据分析顾客的行为从而了解消费者的需求和偏好,甚至能够预测顾客的购买行为。因此本文提出了一种基于用户聚类和特征选择的机器学习模型,根据用户的人口统计学特征对用户进行聚类,再从大量的顾客历史消费数据中学习出消费者购买行为模型,当有新的顾客信息数据和购物行为数据输入时,即可实现对顾客的购买行为进行预测。本文首先对在线购买行为的影响因素和关于购买预测的研究进行了文献综述,对网络购买行为的特点进行了深入分析。同时,本文发现当前以大数据分析为基础的网络购买行为研究仍处于起步阶段,研究的深度和广度还无法满足业界电子商务发展所带来的这方面的诉求。所以本文以阿里巴巴的电子商务交易作为研究背景,并将阿里巴巴大数据竞赛提供的真实购买行为数据以及通过仿真得到的用户人口统计学数据作为研究数据,先对用户进行聚类,再对用户的在线购买行为进行建模。首先使用K-means算法对将用户分为六个类,再用SQL Server以原始数据为基础,构造多个新的特征,并利用基于Extra-trees的特征提取算法,提取出最优的20大特征。然后对每一个用户类,本文选择了逻辑回归算法,将这20个特征输入到对应的预测模型。实验证明,基于用户聚类和特征选择的机器学习预测模型能够较为准确地预测顾客的购买行为。
其他文献
<正>市场研究机构Vanson Bourne对260家大型跨国企业开展调查。调查结果显示,大多数企业(80%)正在投资AI技术,而三分之一企业管理层认为,未来36个月内企业需增加投入,才能赶
在专利侵权纠纷中,如何在专利权人与涉嫌侵权人的权益保护之间取得平衡,在诉讼效果和诉讼成本之间取得平衡,在维护正当权益和防止权力滥用之间取得平衡,是专利侵权研究的热点
三月的北京人民大会堂。万众瞩目。十一届全国人大三次会议。“海西”再次强力吸引全国人民的目光。温家宝总理在政府工作报告中第一次明确提出,“支持海峡西岸经济区在两岸交
电网输配电建设主要为电力能源的输送提供载体,电力的生产、输送以及调配是一个统一的组成部分,输配电的建设可以保证电力能源的稳定传输。对于这种具有规模经济的行业来说,
本文对防护头盔所使用的复合板设计了两个实验来确定其所产生的伤害程度。实验结论:可优化复合材料制成的防弹头盔来避免大范围瞬时变形,从而减少对头部造成的冲击和钝挫伤。
信托,是为财产的转移和管理而设计的特有制度。正是基于信托制度适用的广泛性和灵活性,从信托制度起源至今,已有越来越多的国家将信托制度融入到本国的经济发展和社会生活中
笔者2012年4-5月,采用天灸止痛液治疗重度肩周炎,取得良好的效果,现报告如下。1临床资料1.1诊断标准参照《中医病证诊断疗效标准》[1]和《疼痛诊断标准》[2]拟定,(1)肩关节疼痛
目的:研究尿液检验在临床检验中的影响因素。方法:选取2017年5月-2018年5月检验科收集的380例尿液样本资料,选择110例出现误差的样本进行分析,找出影响检验结果的因素。结果:
房地产投资信托起源于美国,其在立法与实践方面已经相当成熟,已经发展成为美国最为主要的投资房地产以及为房地产业进行融资的金融工具,逐渐在商业房地产投资中占据重要地位,
纳米尺度周期性结构可以对光谱进行目的性、选择性地调节与控制,且采用现有微纳米制造技术制备,在光伏、光电子、传感、探测、无油墨印刷、光热转换器等领域具有广阔应用前景