论文部分内容阅读
【摘要】 协同过滤被广泛应用到个性化推荐中,本文针对传统协同过滤推荐算法准确度不高的问题进行研究,将用户之间共同评分的物品数量作为相似度计算的重要指标,并引入信任度对用户评分进行修正,提高推荐准确度。
【关键词】 协同过滤 信任度 相似度 电影推荐
一、引言
随着互联网的发展,人们很难再海量的数据中快速找到自己需要的资源,很多网站想挖掘用户的偏好向用户推荐他们感兴趣的物品,协同过滤是最常用的推荐技术[1]。推荐技术主要有基于物品的推荐与基于用户的推荐及混合推荐三种。许多研究人员提出了不同的算法来提高推荐可靠性,如采用不同聚类方法的协同过滤[2]。本文采用基于用户的推荐方法,最后实验表明改进后的方法比传统协同过滤算法更可靠。
二、传统协同过滤推荐算法
傳统的协同过滤的一般过程是根据用户评分对用户进行相似度的计算,根据相似度找到用户的邻居用户,然后由邻居用户的喜好来预测评分进行推荐[3]。
用户相似度的计算是产生邻居用户并根据邻居用户进行个性化推荐的重要步骤,Person相似度算法是常用的相似度计算方法。设用户u和v共同评分过的物品集合为Iuv,则相似性sim(u,v)为:
3.1相似度的修正
3.2引入信任度
传统的协同过滤算法在预测用户关于物品的评分时,只考虑了两个用户间的相似度,而忽视了该评分或该用户是否可信。景民昌等人提出“专家信任度”的概念[4],用来衡量用户向其他用户提供可靠信息的能力。用户u关于物品i的评价可信度为
4.1数据集和评价标准
本文采用MovieLens站点提供的ml-100k公开数据集,对提出的算法优化并传统的协同过滤算法进行了对比实验。该数据集包含了943个用户对1682部电影的100000条评分,评分范围是1到5分。
进行实验时,将实验数据的20%用户划为测试集,其它80%用户为训练集。利用训练集用户对测试集用户进行推荐。
采用均方根误差RMSE(Root Mean Squared Error) 来衡量预测结果与用户真实评分之间的误差。
4.2实验结果
本文通过实验来比较传统协同过滤算法与综合改进的协同过滤算法的性能,在邻居数为50的情况下,传统协同过滤算法得到的RMSE为1.15,改进的算法RMSE为0.93,改进的协同过滤方法有较小的误差。由此可知,与传统的相似性度量方法相比,本文提出的改进可以显著地提高推荐系统的推荐质量。
五、结语
本文介绍了协同过滤的基本原理,提出了一种改进的协同过滤算法,一定程度上提高了推荐准确度和可靠性,但实验中仍存在一些问题,有待进一步研究。
参 考 文 献
[1] 项亮. 推荐系统实践[M]. 北京: 人民邮电出版社, 2012: 3-4.
[2] 王国霞, 刘贺平.个性化推荐系统综述[J]. 计算机工程与应用, 2012, 48(7): 66-76.
[3] 邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,14(9):1621-1628.
[4] 景民昌, 唐弟官,于迎辉.基于专家信任优先的协同过滤推荐算法[J],图书情报工作, 2012.56(11): 105-108.
【关键词】 协同过滤 信任度 相似度 电影推荐
一、引言
随着互联网的发展,人们很难再海量的数据中快速找到自己需要的资源,很多网站想挖掘用户的偏好向用户推荐他们感兴趣的物品,协同过滤是最常用的推荐技术[1]。推荐技术主要有基于物品的推荐与基于用户的推荐及混合推荐三种。许多研究人员提出了不同的算法来提高推荐可靠性,如采用不同聚类方法的协同过滤[2]。本文采用基于用户的推荐方法,最后实验表明改进后的方法比传统协同过滤算法更可靠。
二、传统协同过滤推荐算法
傳统的协同过滤的一般过程是根据用户评分对用户进行相似度的计算,根据相似度找到用户的邻居用户,然后由邻居用户的喜好来预测评分进行推荐[3]。
用户相似度的计算是产生邻居用户并根据邻居用户进行个性化推荐的重要步骤,Person相似度算法是常用的相似度计算方法。设用户u和v共同评分过的物品集合为Iuv,则相似性sim(u,v)为:
3.1相似度的修正
3.2引入信任度
传统的协同过滤算法在预测用户关于物品的评分时,只考虑了两个用户间的相似度,而忽视了该评分或该用户是否可信。景民昌等人提出“专家信任度”的概念[4],用来衡量用户向其他用户提供可靠信息的能力。用户u关于物品i的评价可信度为
4.1数据集和评价标准
本文采用MovieLens站点提供的ml-100k公开数据集,对提出的算法优化并传统的协同过滤算法进行了对比实验。该数据集包含了943个用户对1682部电影的100000条评分,评分范围是1到5分。
进行实验时,将实验数据的20%用户划为测试集,其它80%用户为训练集。利用训练集用户对测试集用户进行推荐。
采用均方根误差RMSE(Root Mean Squared Error) 来衡量预测结果与用户真实评分之间的误差。
4.2实验结果
本文通过实验来比较传统协同过滤算法与综合改进的协同过滤算法的性能,在邻居数为50的情况下,传统协同过滤算法得到的RMSE为1.15,改进的算法RMSE为0.93,改进的协同过滤方法有较小的误差。由此可知,与传统的相似性度量方法相比,本文提出的改进可以显著地提高推荐系统的推荐质量。
五、结语
本文介绍了协同过滤的基本原理,提出了一种改进的协同过滤算法,一定程度上提高了推荐准确度和可靠性,但实验中仍存在一些问题,有待进一步研究。
参 考 文 献
[1] 项亮. 推荐系统实践[M]. 北京: 人民邮电出版社, 2012: 3-4.
[2] 王国霞, 刘贺平.个性化推荐系统综述[J]. 计算机工程与应用, 2012, 48(7): 66-76.
[3] 邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,14(9):1621-1628.
[4] 景民昌, 唐弟官,于迎辉.基于专家信任优先的协同过滤推荐算法[J],图书情报工作, 2012.56(11): 105-108.