协同过滤算法中新型相似度计算方法的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:jerryymy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络飞速发展的今天,海量的信息让人们感到迷惑,这种局势使得推荐系统成为了个性化研究领域的热点。协同过滤算法则是推荐系统中使用得最多、最成功的算法。由于相似度计算在协同过滤算法中的重要性,本文通过研究相似度计算方法的手段来提高协同过滤算法的性能。   本文主要研究协同过滤算法中相似度计算方法。针对目前协同过滤算法面临的矩阵稀疏、用户冷启动问题,提出了混合相似度的计算方法,该方法是将改进后的PIP相似度计算方法与传统的相似度计算方法组合起来,并应用到协同过滤算法中。当用户评分达到一定数量时,传统的相似度计算方法还是能很好的反映用户之间的相似程度,为使PIP方法与传统的方法有效的结合,必须找到一个用户评分数量的临界值。当用户评分数量小于这个临界值时,使用PIP方法计算相似度;当用户评分数量大于这个临界值时,使用传统的相似度计算方法计算。   提出了划分相似度的概念。将原来的相似度划分为三个部分:喜欢相似度、不喜欢相似度、中性相似度,再通分配权重方式,将三种类型的相似度组合起来得到最后的相似度。由于喜欢相似度和不喜欢相似度较中性相似度更能反映出用户之间的相似度程度,在将它们组合起来的时候采用了合理的权重系数分配方法。实验证明,划分相似度的计算方法更能反映出用户之间的相似程度。   目前协同过滤算法中的相似度计算忽略了大量有用的信息,针对这一情况,提出了考虑用户客观信息的相似度计算方法。该方法提出两种用户模型:用户基本模型和用户喜好模型。使用某种方法将两个模型量化后,分别计算出用户之间两个模型的相似度。根据两个模型相似度的和,找出目标用户的伪邻居,目标用户再和伪邻居进行评分的相似度计算,计算评分相似度时考虑了目标用户与伪邻居相似的延续性。同时,由于伪邻居概念的提出,本文对伪邻居规模的选取也做了深入的讨论。
其他文献
在过去的近30多年里,互联网得到了极大的发展,给当今世界带来了巨大的改变,对未来社会的发展进步和人们的生产、生活也将会产生深刻的影响。但是随着网络规模和应用需求的不
随着网络技术的高速发展,网络中的应用服务越来越丰富,网络业务流量也急剧增加,人们对于网络流量性质的研究越来越深入,同时对于网络应用系统性能的要求也越来越高。深入研究
关注分离在软件工程上是一种广泛应用的原理,认为难于理解的复杂问题应该被划分为一系列容易理解的简单问题。这些简单问题能够容易解决和集成到原处,从而解决原来复杂的问题
中小型企业的迅速发展,伴随着信息化时代的到来,信息化已经成为制约中小型企业进步的关键问题。目前国内外已经有很多的信息化管理软件,就功能来说已经比较完善,但对于中小型
从计算机网络出现到今天,网络逐渐融入到我们生活的各个角落,它在带来便捷通讯的同时,也带来了各种各样新的问题。其中网络的安全性引起了各个国家、公司的高度重视。如今,网
本文工作是国家“十一五”科技攻关项目“掌纹自动识别系统关键技术研究”的一部分,主要研究脱机掌纹识别的特征提取与过滤,以及多模式掌纹比对问题。在脱机掌纹中,特征数量
学位
随着互联网技术的飞速发展,XML(Extensible Markup Language)已逐渐成为互联网环境中数据交换和表示的事实标准。如何有效地使用XML并实现对XML数据的查询成为互联网发展的重
随着信息时代的发展,传统的高速公路收费方式也面临着变革,而电子收费方式则是一个很重要的方向。传统的全人工收费以及半自动收费方式存在的主要弊端有:(1)收费中的贪污作弊
空间分析是空间信息系统的核心和关键功能之一,也是评价一个空间信息系统功能强弱的重要指标。叠置分析是空间分析的基本功能之一,也是众多空间分析方法的基础。根据不同的数
图像去噪是图像处理方面的一个经典问题,近年来该问题主要采用多尺度几何分析理论进行研究,其中将多尺度几何分析理论与隐马尔可夫模型(HMM)相结合是该领域中的一个研究热点