论文部分内容阅读
线下零售业是数据挖掘重点关注的行业,在线下零售业中有效应用大数据,有利于提升数据竞争力、精准洞察顾客需求。线下零售业一直探索结合移动互联网和大数据技术的道路,但是存在针对性比较低、缺乏个性化等问题。电商领域中发展成熟的推荐算法成为电商行业的主要营销渠道,但是线下零售业还没有成熟的推荐算法来为客户进行个性化推荐。其次,线下零售业中存在的很多噪声数据,也为数据挖掘带来很大的不便。基于以上问题,本课题研究线下零售业中数据挖掘的应用,主要包括基于神经网络的异常检测和基于深度自编码器的推荐算法。异常检测部分中,本文研究可处理异构数据的神经网络异常检测模型在线下零售业异常检测中的应用。该模型是基于数据密度概率统计方法,根据自由能作为异常指标,来判断低密度区域的异常数据。它能够适应线下零售中的异构数据,可将用户的消费次数、消费品牌品类数量、用户性别等异构类型的数据作为神经网络单元的输入,通过非监督学习的方式发现异常用户行为。在线下零售业数据中,用户的偏好数据和购买数据矩阵会非常稀疏,而且线下零售中同样也存在冷启动的问题,这都会影响推荐的准确率。为了解决这个问题,本文主要围绕RFM模型、附加辅助数据与深度自编码器模型的结合方式,研究线下零售业中推荐模型的应用。这个方法可结合从附加信息中学习用户潜在特点,并结合根据RFM模型得到的用户偏好矩阵,进行用户偏好预测和TopN推荐。实验结果证明本文研究的异常检测方法和推荐算法,在线下零售数据中的表现优于现有的热门方法。