论文部分内容阅读
协同过滤(CF)是广泛使用的推荐方法之一,并已在许多领域得到运用。该方法基于类似用户具有相似品味和兴趣的假设。因此,CF使用与被推荐的用户具有相似品味的用户的喜好来获取有用的推荐。为此,用户在项目上给出的历史数据信息用于首先找到类似的用户,然后进行预测。CF存在两个主要问题:数据稀疏性和冷启动问题。与所有可能的评分相比,数据稀疏性是由用户参与评价的项目过少引起的。冷启动问题是指没有足够的先前评级历史记录的项目(或用户)。在冷启动项目(或用户)下,系统通常无法提供高质量的建议。为了缓解以上两个问题,本文主要研究内容如下:[目的]利用帕累托最优概念和信任关系在推荐过程中获取用户的最相似用户。可以提高传统协同过滤推荐中用户相似性的计算精度,从而优化了类似用户的聚类效果,让一些商务平台产生更好的推荐结果,这可以减轻协同算法中经常出现的数据稀疏以及冷启动难题带来的干扰。[研究内容]这篇文章将经济学中的帕累托最优思维和社会关系中的信任关系,考虑到协同过滤推荐算法中。方法步骤如下:首先,根据信任关系确定信任网络,同时生成预测评分集;其次,根据生成的评分集,计算调节因子,用来改进传统的协同过滤算法,获得相似值;第三,利用帕累托最优原则识别主导用户,重构信任网络,利用重构的信任网络计算相似值。第四,预测评分,实施推荐。添加调节因子和利用帕累托概念是本文的创新之处。[研究方法]首先利用皮尔森相关系数计算相关系数,然后用帕累托最优概念重构信任网络,最后,通过平均绝对误差指数进行实验评估。通过文章结尾的两个实验案例和最后一个小的实证分析,可以初步的认为:本篇论文提及的改进方法与传统的协同过滤的算法而言,提高了准确性,更深一步地缓解了冷启动性的难题和稀疏性的难题。[局限]本篇论文着重点在方法的创新上,所以实证部分显得相对单薄,真实数据源虽然很多,但是经筛选处理后,参与实验的数据量不大,这是这篇文章的薄弱之处。[结论]数量庞大的用户间的信任关系包含特别有价值的信息,通过质与量之间的转换,量化用户间的信任信息,并结合用户的其他信息进行相似值的计算,然后利用帕累托最优原则筛选最信任用户,优化传统的皮尔森公式,并实施协同过滤推荐。