PageRank向量的计算与加速

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:ununszeto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上网搜索时,搜索引擎往往会列出成千上万个看似无序的相关网页。殊不知,搜索引擎在呈现这些网页之前,已经根据它们的“重要性”排定座次。好的、重要的网页会被排在前面。 Google是现今世界上最成功的搜索引擎。在Google所有用来决定网页综合排名的评定标准中,PageRank是核心。 从数学的角度看,PageRank向量之求解,可以通过解线性方程组,或求Google矩阵主特征向量(即PageRank向量)来实现。但Google用于计算的矩阵其阶数已经超过250亿,致使求解计算极具挑战性。 PageRank算法是一个可以客观而有效地度量每个网页重要性的方法。本文首先介绍了PageRank算法的模型建立与主要性质。接着,在现有关于PageRank计算的研究基础之上,作者给出了两个新颖而有效的加速计算方法。最后,将这两个方法加以整合,并在四个数据集上进行了数值实验。从实验结果可以看到,计算得到明显加速。
其他文献
从1991年到1992年,Baumslag等人以及Epstein等人分别系统地对自动机群进行了研究.之后的十五年中,自动机群成为了组合群论的一个热门的研究方向.这类群之所以受到众多学者的关注,
本文主要研究气体动力学二维零压流。利用特征分析方法,通过研究狄拉克激波,真空和接触间断之间的相互作用,完整地解决了带有三片常数的黎曼问题。 第一章考虑三初始间断分别
学位
关于神经网络的研究在近几年取得了令人瞩目的进展,引起了包括计算机科学、脑神经科学、人工智能等学科领域内的科学家们的巨大热情和广泛兴趣。神经网络是人类对其大脑信息处
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本文主要分两个部分,第一个部分是与广义逆符号唯一阵相关问题的研究,主要包含在第二,第三以及第四章中;第二部分是关于树的拉普拉斯特征值的部分和的可达上界问题,即第五章。
作为信息技术课程的一线实践者,许多信息技术教师对信息技术课程价值认识不深入,他们只是根据教材或自身的教学经验进行信息技术课程教学,很少思考为什么要开设信息技术课程
常用的软件可靠性模型都假定失效数据服从一定的随机分布,并且需要一定的失效数据量才能体现模型的统计特性。由于高可靠软件在可靠性测试过程中的失效数据少,这些常用模型难以
要提高群文阅读的有效性、实现群文阅读的教学目标,就要以议题为抓手,善于研定议题.研定议题要依“标”、循“本”、据“时”,可以根据单元主题研定议题、根据训练重点研定议
本文研究两台机器混合作业排序问题M2|Sij,rij|Cmax,其中每道工序需要准备、加工和移出三个步骤,相应的时间要求分别为sij,pij和rij(1≤i≤2,1≤j≤n)。准备步骤和移出步骤分别是