论文部分内容阅读
推荐系统是一个帮助用户寻找发现所需信息的服务系统,让丰富的信息或者产品高度个性化的展示在用户面前,满足用户的各种需求,改进了用户体验;对企业来说也提高了购买转化率进而增加了利润。近些年随着网络的迅速发展,推荐系统逐渐渗透到生活的各个领域,典型的如电子商务等。推荐系统利用用户的各种属性信息、历史行为数据以及产品的特征数据等,分析预测用户的喜好,为用户产生个性化推荐结果。 协同过滤推荐算法并不借助用户或者物品的属性信息,只通过分析用户的历史行为,从中找出用户和物品的相互关系,预测用户的喜好从而产生推荐。这个优点使其成为推荐系统中最流行的一类算法。邻居模型(kNN)、矩阵分解算法(MF)等在各个领域中有非常广泛的应用,其中邻居模型(kNN)是协同过滤算法中应用最为广泛的模型之一。 在线交友是近些年新兴的推荐系统应用领域,主要目标是为用户推荐喜欢并且可能建立正向联系的异性。不同于传统的用户-物品推荐系统,物品是静态的,推荐的成功与否只取决于用户单方面的偏好;人与人之间的推荐难度更高,用户可以对收到的信息作出反馈,双方的喜好都需要被考虑,推荐的结果需要高度符合双方的喜好。 在人与人推荐领域,迄今为止并没有成熟通用的协同过滤算法,相关研究者多数也是进行一些框架性的探讨。本文基于婚恋交友网站“世纪佳缘”收集到的用户行为数据,对人与人推荐系统进行了研究;在总结相关人员研究成果的基础上,扩展了邻居模型(kNN),主要的贡献如下: 提出了修正概率协同过滤算法(Modified Probabilistic Collaborative Filtering)。该方法放弃了传统的对称相似度的形式,采用了更加能反应人与人之间共性和特性的不对称相似度;同时充分考虑了用户间负向联系占绝大多数的统计规律,修正了传统的概率协同过滤算法中的相似度计算形式;最后以数学上求期望的形式预测用户评分,是一个更加符合现实应用情景的算法。计算结果表明与基本邻居模型(Basic kNN)和概率协同过滤(ProCF)相比,在多个指标上明显提高了Top-N推荐问题的预测精度。 提出了混合算法。该方法结合邻居模型(kNN)推荐精度高、易于解释的优点和隐式因子模型(MF)能高效的填充评分矩阵元素的优点,试图利用两个单向选择模拟双向选择,最终使用双方用户对彼此的预测评分去衡量建立正向联系的可能性,并通过在线测评验证了其有效性。