论文部分内容阅读
随着电子商务和互联网的迅速发展,信息迷航和冗余给人们在信息了解和商务工作方面带来很多困惑与不便,因此迫切希望出现一种能真正了解其需求的个性化推荐技术。本文研究了个性化推荐系统的相关技术及概念,其中协同过滤技术是本文研究的切入点,鉴于协同过滤存在的问题本文提出了新的解决方法。基于用户的协同过滤算法是协同过滤算法思想的精髓,也是最早提出的算法,比较易于理解,它在推荐效果方面具有良好的优势,但是这种技术在系统比较庞大的时候,稀疏性和冷开始问题尤为严重,这将严重制约着系统的推荐效果。基于项目的协同过滤算法是对原有协同过滤思想进行一种换位思考,该算法在一定程度上解决了基于用户协同过滤算法所面临的稀疏性问题,即使在矩阵不是特别稀疏的情况下,其推荐精度也不会滞后于基于用户的协同过滤推荐算法,但该算法没有从根本上解决稀疏性问题。基于SVD降维的协同过滤算法首先对矩阵进行降维处理,然后直接进行预测,该方法也解决了部分稀疏性问题,在推荐精度上也取得了明显效果,但算法的思想不易于理解。项目的特征制约着用户的兴趣,因此项目或用户之间的相似度与用户对项目本身所具有的特征的喜爱程度有关,若用户对项目本身所具有的特征特别喜爱,最终项目或用户间的相似度几乎没受到什么影响,若用户对项目本身所具有的特征喜爱概率低,可能会使项目或用户间的最终相似度变得更小。在以上分析的基础上,本文的所做的主要工作及创新主要体现在以下几个方面:1)在第三章提出了一种基于邻居动态决策的协同过滤推荐算法,首先对用户——项目评分矩阵进行SVD降维处理,根据降维后得到的用户矩阵和项目矩阵采用最近邻思想,计算用户间的相似度以及项目间的相似度,对每个待预测项比较当前用户的邻居数和项目的邻居数,由邻居数大的那方采取相应的协同过滤算法进行预测,这种动态决策的思想比单独使用一种方法的推荐效果好,在实验中给出具体验证。2)在第四章提出了一种融入贝叶斯理论进行项目预测的协同过滤推荐算法,首先利用贝叶斯理论计算出每种类型的项目被用户喜欢的概率,并将用户对项目类型的喜爱概率融入到相似度的计算中,得到一种新的相似度计算方法,然后采用基于项目预测的方法,即先对用户评分的并集中未评分的项采用基于项目的方法进行预测,然后再根据并集计算相似度并对剩余未评分的项进行预测,由于相似度中融入了对类型的喜爱概率,这样更符合实际人们的心理,同时通过并集计算也减少了稀疏性问题,该方法取得了显著的推荐精度,实验部分给出其实际的效果。3)本文对预测值提出了一种简单且有效判定方法,每个预测值均带有小数位,而原始的评分都采用等级评分对应整数,传统方法对预测值采用简单四舍五入取整,该方法虽然简单但是取舍缺乏依据,而本文采用用户的评分趋势来对预测值进行取舍,若用户本身偏向评高分,则对预测值均采用向上取整的方法,若用户偏向评低分,则对预测值采用向下取整的方法,取舍前后推荐精度有明显的不同,实验部分也给出了具体验证。4)通过对各种方法验证了以上思想的可行性,根据实验结果可以看出推荐精度均有不同程度的改善,文中提出的方法均对稀疏性问题进行了处理,至于冷开始问题,文中也提到了具体的解决办法,但本文主要是考虑稀疏性问题。