论文部分内容阅读
随着互联网技术的不断发展,网络中的信息呈爆炸式的增长趋势,造成用户无法快速准确地找出满足自身需求的信息,这就是著名的“信息过载问题”。信息推荐技术,也称个性化推荐系统,是目前解决信息超载问题的有力工具之一。借助于复杂网络以及数据挖掘相关理论和方法,本文致力于分析二分网络的拓扑结构特征与推荐算法性能之间的关系,分别探究单一网络拓扑统计量对推荐效果的影响。主要工作如下:1.探究了二分网络的聚类系数与推荐算法性能之间的关系。通过采用几种典型的评价指标量化推荐效果,本文系统地分析了多种推荐算法在具有不同聚类系数的二分网络(推荐网络)中的性能。实验结果表明,推荐算法的性能与二分网络的聚类效应具有强关联性,推荐算法的推荐效果在具有高聚类特性的二分网络中明显优于聚类特性低的二分网络。2.研究了两种包含二分网络整体结构信息的拓扑特性(即网络稀疏性和用户对象比)分别对推荐算法效果的影响。首先分析网络稀疏性对六种推荐算法性能的影响程度。其次,针对推荐系统中用户和物品的数目不断变化的问题,本文提出一种新的二分网络拓扑结构(用户对象比)来度量用户和物品数目的差异性,并分析它对推荐算法的影响。实验结果表明,推荐准确性随着网络稀疏性的增加逐渐变得优越,但准确性与网络稀疏性并不是成线性关系;推荐多样性和推荐新颖性指标并没有随着网络稀疏性的增加而表现的更好。此外,推荐算法随着用户对象比的增加其预测准确性均逐渐提升;而推荐多样性在具有不同用户对象比的推荐网络中,各种算法表现情况不一致;推荐新颖性指标的值与用户对象比成正相关线性关系。3.分析了二分网络中的社团结构对协同过滤推荐的影响。本文考虑二分网络的异质社团对协同推荐的贡献量,通过引入重叠因子优化用户相似度的计算,提出一种基于异质社团的协同过滤算法(CB-CF)。利用二分网络的社团特性,CB-CF算法在准确性、多样性以及新颖性方面均比传统的协同过滤算法表现更精确。