论文部分内容阅读
上网搜索时,搜索引擎往往会列出成千上万个看似无序的相关网页。殊不知,搜索引擎在呈现这些网页之前,已经根据它们的“重要性”排定座次。好的、重要的网页会被排在前面。
Google是现今世界上最成功的搜索引擎。在Google所有用来决定网页综合排名的评定标准中,PageRank是核心。
从数学的角度看,PageRank向量之求解,可以通过解线性方程组,或求Google矩阵主特征向量(即PageRank向量)来实现。但Google用于计算的矩阵其阶数已经超过250亿,致使求解计算极具挑战性。
PageRank算法是一个可以客观而有效地度量每个网页重要性的方法。本文首先介绍了PageRank算法的模型建立与主要性质。接着,在现有关于PageRank计算的研究基础之上,作者给出了两个新颖而有效的加速计算方法。最后,将这两个方法加以整合,并在四个数据集上进行了数值实验。从实验结果可以看到,计算得到明显加速。