论文部分内容阅读
随着信息技术与电子商务的不断发展,用户交易数量与商品数量与日俱增,商务大数据为产业界和学术界带来了宝贵机遇和严峻挑战。人们在更容易接触到丰富的商品信息的同时,找到合适商品的代价却越来越高,信息过载问题也变得越来越严重。商品推荐是解决这一问题的重要途径,因此,如何从海量商品集中高效地为用户推荐商品成为了近年来的研究热点之一。通过商品推荐,一方面可提升用户的购物体验与服务满意度,另一方面也可以帮助商家获得更多的销售量与销售利润。目前,商品推荐仍然面临数据稀疏性问题、长尾问题等挑战,这些问题严重制约着商务推荐系统的发展。为解决上述两个问题,本文基于真实数据集与现实需求,结合实际商务环境中商品种类与用户类别的多样性,研究面向特定类型用户的商品推荐方法。本文的主要贡献有:1.借鉴关联规则算法的思想,设计一种商务数据环境下可智能识别特定用户的方法。该方法首先选取种子商品,然后利用种子商品和其他商品的强关联规则,分层次赋予商品权重,再将权重映射到用户身上从而得到一个特征值,最后依据用户特征值来识别用户类型。该方法只利用购物记录数据,就能有很好的表现。通过真实数据集上的实验,以识别超市中婴幼儿家庭用户为例,证明了该方法的效果。2.借鉴协同过滤算法的思想,设计了一种商品推荐方法。该方法建立了一个隐语义模型来完成推荐。通过把特征向量矩阵分解成两个远远小于原矩阵的特征向量矩阵,建立损失函数,把推荐问题转换成一个求最优解的问题。它运用最小二乘法的原理来逐步拟合,从而得到未知的特征值。最后依靠最近邻用户的数据,补全预测用户大量缺失的特征值,在数据稀疏且规模庞大的情况下表现更好。并且该方法采用了惩罚因子降权进行改进,可以控制热门商品的特征向量不会在算法迭代的过程中爆炸增长,有效降低了热门商品对推荐结果的影响。3.搭建了一个可以处理海量数据的分布式计算平台,对超市用户分别进行了特定用户的识别和商品推荐,有很强的商业价值。