基于用户偏好的协同过滤推荐方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:kaixinlfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络资源的爆炸式增长,加剧了信息过载问题,推荐技术应运而生成为解决这一问题最有效的方法之一,其中的协同过滤推荐,是目前最成功的推荐技术之一。它通过分析与目标用户相似性高的近邻用户的偏好,将近邻用户喜欢的项目推荐给目标用户。尽管协同过滤取得了巨大成功,但却存在数据稀疏性、可扩展性和群组推荐等关键问题,这些问题制约着其进一步发展,因此本文对这些问题展开深入的研究。本文的主要研究内容如下:1.通过改进的TF-IDF构建了用户项目特征偏好矩阵,从而减少了用户项目特征偏好矩阵的维数。针对数据稀疏性问题,引入项目特征,同时考虑用户的兴趣漂移对用户偏好的影响,通过改进的TF-IDF构建用户项目特征偏好矩阵,由于物品的项目特征能从内容方面来表现用户的偏好,且项目的领域特征远少于项目的数量,减少了用户项目特征偏好矩阵的维数。2.针对可扩展性问题,提出一种改进的K-Means用户聚类的方法。该方法通过类间差异度和类内差异度确定最终的K值来解决K-Means方法需要人为设定初始K值的问题。在类内计算目标用户与其他用户的相似度来得到近邻集,并进行预测评分和推荐,提高了效率和扩展性。3.针对传统的协同过滤算法适用于对个体推荐而不适用于群组用户推荐,设计了一种基于用户项目特征偏好和评分来构建群组偏好模型。根据群组成员间的相互作用构建群组评分矩阵和项目特征偏好矩阵,以基于用户的协同过滤算法为基础,将群组用户看成一个虚拟用户,进行相似度计算和预测评分。4.通过引入权重因子的方法,构建了一种综合相似度计算方法。传统的相似性计算是利用用户间共同的评分,然而相似性不仅与用户的评分有关,而且与用户对不同项目特征的偏好程度有关。两者从不同角度体现用户的偏好。因此,使用权重因子将两者结合起来,计算综合相似度。最后将本文所提出的方法与几种常用方法在MovieLens数据集进行实验,从MAE、Precision、Recall三个指标验证本文方法的有效性,从一定程度上缓解稀疏性、可扩展性和群组推荐问题。
其他文献
摘要:2010年去过数学建模大赛C题“输油管的布置”数学建模的目的是设计最优化的路线,建立一条费用最省的输油管线路,但是不同于普遍的最短路径问题,该题需要考虑多种情况,例如,城区和郊区费用的不同,采用共用管线和非公用管线价格的不同等等。我们基于最短路径模型,对于题目实际情况进行研究和分析,基于光的传播原理,设计了一种改进的最短路径模型,对问题设计了合适的数学模型并做出了相应的解答和处理。  关键词
目的观察度洛西汀对脑卒中后抑郁症(PSD)患者下丘脑-垂体-肾上腺轴(HPA轴)及认知功能的影响。方法该院84例PSD患者,按随机数字表法分为观察组与对照组各42例。两组均予脑卒中常规
<正> 全国铁路运营全系统从最基层的生产班组起,直至铁道部最高一级实现微机管理物资消耗信息已达4年。在取得经济效益和提高工作质量等方面成绩斐然。工作效率提高百倍以上,
论质量和效益魏成广美国现代质量管理协会主席哈林顿曾这样描述过:现代世界上正进行着一场第三次世界大战。这不是一场使用枪炮的流血战争,而是一场商业战。这场战争的主要武器
在当今计算机网络和互联网高度发展时期,各种各样的搜索引擎不断崛起。以雅虎、百度等著名的搜索引擎都提出各种搜索技术,方便广大网民在互联网上搜索自己需要的信息和资料。对
由浙江华东阀门有限公司研发的高温高压双自紧密封闸阀,日前通过科学技术部火炬高新技术产业开发中心验收,被正式录入国家火炬计划项目。
新时代,生态体验已成为德育现代化的新方位。党的十九大报告把生态文明提到千年大计的新高度。习近平总书记深刻指出:“人与自然是生命共同体,人类必须尊重自然、顺应自然、保护
报纸