协同过滤推荐算法的研究

被引量 : 0次 | 上传用户:XPTRY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务和互联网的迅速发展,信息迷航和冗余给人们在信息了解和商务工作方面带来很多困惑与不便,因此迫切希望出现一种能真正了解其需求的个性化推荐技术。本文研究了个性化推荐系统的相关技术及概念,其中协同过滤技术是本文研究的切入点,鉴于协同过滤存在的问题本文提出了新的解决方法。基于用户的协同过滤算法是协同过滤算法思想的精髓,也是最早提出的算法,比较易于理解,它在推荐效果方面具有良好的优势,但是这种技术在系统比较庞大的时候,稀疏性和冷开始问题尤为严重,这将严重制约着系统的推荐效果。基于项目的协同过滤算法是对原有协同过滤思想进行一种换位思考,该算法在一定程度上解决了基于用户协同过滤算法所面临的稀疏性问题,即使在矩阵不是特别稀疏的情况下,其推荐精度也不会滞后于基于用户的协同过滤推荐算法,但该算法没有从根本上解决稀疏性问题。基于SVD降维的协同过滤算法首先对矩阵进行降维处理,然后直接进行预测,该方法也解决了部分稀疏性问题,在推荐精度上也取得了明显效果,但算法的思想不易于理解。项目的特征制约着用户的兴趣,因此项目或用户之间的相似度与用户对项目本身所具有的特征的喜爱程度有关,若用户对项目本身所具有的特征特别喜爱,最终项目或用户间的相似度几乎没受到什么影响,若用户对项目本身所具有的特征喜爱概率低,可能会使项目或用户间的最终相似度变得更小。在以上分析的基础上,本文的所做的主要工作及创新主要体现在以下几个方面:1)在第三章提出了一种基于邻居动态决策的协同过滤推荐算法,首先对用户——项目评分矩阵进行SVD降维处理,根据降维后得到的用户矩阵和项目矩阵采用最近邻思想,计算用户间的相似度以及项目间的相似度,对每个待预测项比较当前用户的邻居数和项目的邻居数,由邻居数大的那方采取相应的协同过滤算法进行预测,这种动态决策的思想比单独使用一种方法的推荐效果好,在实验中给出具体验证。2)在第四章提出了一种融入贝叶斯理论进行项目预测的协同过滤推荐算法,首先利用贝叶斯理论计算出每种类型的项目被用户喜欢的概率,并将用户对项目类型的喜爱概率融入到相似度的计算中,得到一种新的相似度计算方法,然后采用基于项目预测的方法,即先对用户评分的并集中未评分的项采用基于项目的方法进行预测,然后再根据并集计算相似度并对剩余未评分的项进行预测,由于相似度中融入了对类型的喜爱概率,这样更符合实际人们的心理,同时通过并集计算也减少了稀疏性问题,该方法取得了显著的推荐精度,实验部分给出其实际的效果。3)本文对预测值提出了一种简单且有效判定方法,每个预测值均带有小数位,而原始的评分都采用等级评分对应整数,传统方法对预测值采用简单四舍五入取整,该方法虽然简单但是取舍缺乏依据,而本文采用用户的评分趋势来对预测值进行取舍,若用户本身偏向评高分,则对预测值均采用向上取整的方法,若用户偏向评低分,则对预测值采用向下取整的方法,取舍前后推荐精度有明显的不同,实验部分也给出了具体验证。4)通过对各种方法验证了以上思想的可行性,根据实验结果可以看出推荐精度均有不同程度的改善,文中提出的方法均对稀疏性问题进行了处理,至于冷开始问题,文中也提到了具体的解决办法,但本文主要是考虑稀疏性问题。
其他文献
近年来,国内外许多学者对股票市场作了大量的理论和实证研究,取得了许多具有理论价值和实际意义的科研成果。然而股市的变化是难以预测的,经过十八年之久的建设,很多情况发生
<正> 道教是我国土生土长的古教,是汉末农民大起义——黄巾起义的组织者。至于道教的产生,它的本质,它与古宗教的关系以及它的创始人等问题,至今有着不同的看法。本文拟就几
航空公司是向市场提供位移服务的运输企业。航空公司可分为传统的航空公司和低成本航空公司。所谓低成本航空公司即通过内部低成本运营实现外部低票价竞争的航空公司,通常低
我国绿色建筑的发展亟需相关运营管理标准的支持。在对国内外已有绿色建筑相关标准梳理基础上,针对我国绿色建筑运营阶段存在的问题,探讨绿色建筑运营管理标准的构建原则和方
在公司治理中,完备的内部会计控制制度是减少会计信息失真,强化会计监督的重要保证。本文对企业内部会计控制制度的必要性、内容和我国推行内部会计控制制度的设计方法进行了
长期以来,中国英语教学界一直热衷对两种不同教学方法的探讨:一种是以强调语法为主的语法翻译法;另一种是以培养学生听说能力为主交际法。前者以应试为主,重视语言形式而忽略学
本研究将4种单一吸附剂的不同水平间进行复配添加到自然霉变肉鸡日粮中进行试验,从中筛选最佳组合并进行优化验证。试验一采用四因素三水平正交设计,选1日龄罗斯308肉鸡432羽
介绍了脑血管疾病严重危害人类健康,脑循环功能治疗仪通过交变电磁场刺激颅脑、仿真生物电刺激小癌顶核和患肢肌肉神经来达到治疗目的,取得了较好的效果。
简述了超临界流体介质的特性和染色机理流程,从预处理方式、染色工艺条件、染料种类和纤维品几种方面概述了超临界CO2染色过程对天然纤维和合成纤维性能的影响,总结了超临界C
介绍了霍山石斛的概况,从中药农业、工业、商业的角度阐述了霍山石斛产业化发展的重要性和可行性。在分析霍山石斛资源状况的基础上,着重剖析霍山石斛产业化发展面临的主要问