论文部分内容阅读
为解决网络信息过载问题,个性化推荐系统及推荐算法成为各界研究和应用的难点与热点。针对传统的协同过滤算法存在的可扩展性、数据稀疏性、冷启动以及同义词等问题,本文以提高个性化推荐系统中活动用户的最近邻居查询的质量和效率为出发点,重点对传统的协同过滤算法在应用中存在的可扩展性和数据稀疏性问题进行探讨,提出一种改进的协同过滤推荐算法,并对所提出的算法进行实证分析,验证了本文研究成果的有效性和可行性。本文的主要工作如下:第一章:绪论部分。介绍了课题的研究背景、研究现状及存在的问题、本文的主要研究内容与研究思路以及论文的结构安排。第二章:个性化推荐系统及相关推荐技术。简述了电子商务推荐系统的分类、体系结构,介绍了基于内容的推荐、基于模型的推荐、组合推荐、协同过滤推荐技术及其推荐原理和步骤。第三章:基于K-means和项目类别偏好的用户聚类。针对协同过滤推荐存在的可扩展性问题,介绍了目前协同推荐中聚类算法的应用情况,提出了基于K-means和项目类型偏好的聚类算法。该算法通过对用户进行离线聚类,将项目类偏好相似的用户划分到相同的用户簇,基于聚类推荐的在线邻居查找可以从与目标用户最近的若干个用户簇中进行,进而提高了邻居查询效率。第四章:基于聚类和项目类别偏好的协同过滤推荐算法。考虑到传统的基于用户的协同过滤算法在数据稀疏性环境下推荐质量不佳,本章首先提出了一种基于项目类别偏好的协同过滤推荐模型。该模型在目标用户的邻居集合确定阶段综合考虑用户的项目评分信息和项目类偏好信息,使得邻居查找更准确,提高了系统的推荐质量。然后结合第三章中提出的聚类算法和此模型形成基于聚类和项目类别偏好的协同过滤推荐算法,并给出其推荐流程。第五章:实验设计与结果分析。基于MovieLens数据集,对本文提出的改进算法进行了实验仿真,相对于传统的协同过滤推荐算法,本文提出的改进算法具有良好的最近邻居查询效率,在一定程度上缓解了传统协同过滤算法存在的可扩展性问题,并有效地解决了传统的协同过滤算法在数据稀疏、高维情况下的推荐质量问题。第六章:总结与展望。简单总结了论文的主要研究内容及成果,并且对论文的下一步的研究提出了一定的展望。