论文部分内容阅读
随着社会的不断发展,科学技术的不断进步,越来越多的人们已经把获取信息的主要途径从看报纸、电视和直接上指定目标的官方网站转向了搜索引擎工具。为了适应人们日益增长的网上搜索需求,对于网页排序模型的研究越来越活跃。PageRank算法作为一个著名的网页排序算法,其本质上可以视为谷歌矩阵的主特征向量的求解问题。本文以PageRank算法及其快速算法为研究方向,以链接矩阵分析和Krylov子空间法为切入点,研究了PageRank问题的快速计算方法。本文的主要的研究内容分为了两部分。在第一部分中,我们提出了Arnoldi-PET算法。Power-Arnoldi算法是解决PageRank问题的一种非常优秀的算法。Arnoldi-PET算法可以视为Power-Arnoldi算法的一种变形算法,即在该算法中引入基于矩阵的迹的外推策略。幂迭代方法不仅计算成本较低而且易于实现,但是当阻尼因子趋近于1时,其收敛速度非常慢。基于矩阵的迹的幂迭代方法(PET)是幂迭代方法的一种改进。Krylov子空间法对于求解大型稀疏矩阵的特征向量非常有效。相较于幂迭代等方法,其通常在较少的迭代次数下就能收敛。谷歌矩阵作为一个典型的大型稀疏矩阵,随着网络的不断发展,矩阵的阶数的量级越来越大。显然,上述方法都不能高效的满足需求。基于这样的认识,新算法将每次迭代较快但计算成本较高的thick restarted Arnoldi算法和计算成本较低的PET算法结合起来,通过有效的迭代策略使得PageRank问题的收敛速率加快。在算法的构造中,首先根据幂迭代的收敛率对PET算法进行变形,即构造新参数用于控制PET算法中幂迭代的执行,然后利用一些重启参数控制变形的PET算法和thick restarted Arnoldi算法之间的循环跳转。本文对Arnoldi-PET算法的收敛性进行了分析,并通过数值模拟检验了该算法的有效性。在第二部分中,我们提出了GArnoldi-PET算法。该算法利用加权内积的思想,对Arnoldi-PET算法做了进一步研究。类似于Arnoldi-PET算法的构造机制,GArnoldi-PET算法是自适应的广义Arnoldi算法(A-Arnoldi)与PET算法的周期性结合。为了进一步提高收敛率,在每一次外层迭代后根据残差向量自适应的改变加权内积的权重向量。本文通过对新算法进行数值模拟,看到了其相对于算法Arnoldi-PET的进一步优化,并且在数学上证明了它的收敛性。