论文部分内容阅读
近年来,随着互联网技术的日益发展和普及,与个性化推荐相关的服务被广泛应用到生活的方方面面。个性化推荐技术不仅能够从海量信息中帮助用户发现想要的内容,而且还能够给商家带来巨大的经济收益。推荐系统通过分析用户之前的行为数据,能够挖掘出用户的兴趣偏好,从而给用户提供精准的推荐内容和服务。本文的主要内容分别从显式(用户的评论)和隐式(用户的浏览行为)两种方式来分析和挖掘用户的偏好信息,从而分别给用户推荐商家和给商家推荐新客户。如何融合用户的偏好信息到推荐模型中,以及数据本身存在的稀疏性和异构型给推荐系统带来了很大挑战。于是本文分别提出了相应的模型来解决上述挑战,具体来说,包括以下两方面的内容。第一,针对用户显式偏好的研究问题,本文提出了一种基于用户评论信息的商家推荐模型。用户的评论信息蕴含了用户对商家不同方面的偏好信息,通过有效的建模和算法设计来融合这些信息可以极大地提升个性化推荐的效果。具体来说,本文提出了一个融合用户偏好信息到协同过滤的概率图推荐模型。然后本文使用了一种基于高斯模型的优化方法来训练模型的参数。最终本文在两个典型的数据集上验证了模型的有效性和可扩展性。实验结果表明本文提出的融合用户偏好信息的概率图推荐模型在平均绝对误差(MAE),均方根误差(RMSE)和召回率(RECALL)等指标上要优于传统的方法,而且在冷启动问题上表现也要好于基线方法。第二,针对用户隐式偏好的研究问题,本文构建了一个融合用户浏览和购买信息的新客推荐模型。在电商领域中,用户拉新对商家推广和增加品牌影响力具有十分重要的意义。用户在站内的历史浏览信息和购买信息很大程度上反映了用户的兴趣偏好,通过合理的建模和有效的算法来融合这些信息能够提高新客推荐的效果。具体来说,本文提出了一个融合商品Embedding信息的多层神经网络推荐模型。首先基于用户的历史浏览商品序列将品牌和店铺等商品对应的属性进行Embedding。然后结合用户的用户画像信息和浏览购买信息将每一个用户表示成一个多维向量,接着输入给多层的神经网络模型。最终本文在一个电商公司的两个真实的厨房电器商家上验证模型的用户拉新效果。实验结果表明,我们的方法在AUC(Area Under Curve)指标上要优于传统的方法。