论文部分内容阅读
随着信息过载问题的日益突出,个性化系统受到了越来越多的关注。在个性化系统中,用户不需要主动提供自己的浏览意图,而是系统根据用户的历史行为,对其当前浏览行为做出预测。但是,相对于海量的信息飞速增长,仅仅依靠用户的历史记录对用户的兴趣进行判断,准确率较低。在对用户进行向量表示的时候,用户的特征向量会极度稀疏,直接导致了推荐结果准确率不高。因此,提高推荐的准确程度以及解决数据稀疏性问题已经成为个性化系统发展的必然要求。针对现有推荐方法存在的数据准确率较低和数据稀疏性问题,本文分别采取了添加用户信息,以及在用户信息的基础上进行最近邻居计算,然后根据最近邻居对数据进行平滑的方法。首先,本文描述了个性化系统的研究背景和意义,归纳和总结了有关个性化技术的相关研究,系统、详细的介绍了国内外推荐系统的研究现状。对于现有技术,本文从基于内容推荐和基于协同推荐两个方面入手,梳理了内容推荐和协同推荐的常用方法,并评价了各种方法的优缺点。接下来,基于扩展的推荐方法,本文将用户的信息进行离散化处理,提高了推荐的准确率。在离散化处理的基础上,本文将用户信息与用户的评分矩阵结合,并将矩阵转化成0、1矩阵,在此基础上继续进行SVD分解,然后进行推荐。这样做的好处是,加入了用户的信息,拓展了推荐的信息来源,改进了单纯依靠评分数据的推荐方法。最后,为了降低数据稀疏的影响,在对用户信息数据融合的基础上进行用户聚类,并对用户进行最近邻居计算和数据平滑。针对用户扩展数据是0、1的取值,采用了新的相似度计算公式计算邻居,并根据用户信息计算出来的邻居对评分数据进行平滑处理。在平滑处理的结果上进行聚类分析,计算聚类中心,并计算后续新用户与聚类中心的距离,找出最近的聚类,计算最近邻居,并以最近邻居为依据进行最终推荐。