基于链接矩阵分析的PageRank算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:adu198612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断发展,科学技术的不断进步,越来越多的人们已经把获取信息的主要途径从看报纸、电视和直接上指定目标的官方网站转向了搜索引擎工具。为了适应人们日益增长的网上搜索需求,对于网页排序模型的研究越来越活跃。PageRank算法作为一个著名的网页排序算法,其本质上可以视为谷歌矩阵的主特征向量的求解问题。本文以PageRank算法及其快速算法为研究方向,以链接矩阵分析和Krylov子空间法为切入点,研究了PageRank问题的快速计算方法。本文的主要的研究内容分为了两部分。在第一部分中,我们提出了Arnoldi-PET算法。Power-Arnoldi算法是解决PageRank问题的一种非常优秀的算法。Arnoldi-PET算法可以视为Power-Arnoldi算法的一种变形算法,即在该算法中引入基于矩阵的迹的外推策略。幂迭代方法不仅计算成本较低而且易于实现,但是当阻尼因子趋近于1时,其收敛速度非常慢。基于矩阵的迹的幂迭代方法(PET)是幂迭代方法的一种改进。Krylov子空间法对于求解大型稀疏矩阵的特征向量非常有效。相较于幂迭代等方法,其通常在较少的迭代次数下就能收敛。谷歌矩阵作为一个典型的大型稀疏矩阵,随着网络的不断发展,矩阵的阶数的量级越来越大。显然,上述方法都不能高效的满足需求。基于这样的认识,新算法将每次迭代较快但计算成本较高的thick restarted Arnoldi算法和计算成本较低的PET算法结合起来,通过有效的迭代策略使得PageRank问题的收敛速率加快。在算法的构造中,首先根据幂迭代的收敛率对PET算法进行变形,即构造新参数用于控制PET算法中幂迭代的执行,然后利用一些重启参数控制变形的PET算法和thick restarted Arnoldi算法之间的循环跳转。本文对Arnoldi-PET算法的收敛性进行了分析,并通过数值模拟检验了该算法的有效性。在第二部分中,我们提出了GArnoldi-PET算法。该算法利用加权内积的思想,对Arnoldi-PET算法做了进一步研究。类似于Arnoldi-PET算法的构造机制,GArnoldi-PET算法是自适应的广义Arnoldi算法(A-Arnoldi)与PET算法的周期性结合。为了进一步提高收敛率,在每一次外层迭代后根据残差向量自适应的改变加权内积的权重向量。本文通过对新算法进行数值模拟,看到了其相对于算法Arnoldi-PET的进一步优化,并且在数学上证明了它的收敛性。
其他文献
针对已经存在的推荐算法中数据的稀疏性问题,提出一种基于聚类算法的二分图信任网络构造算法,通过聚类技术把项目评分相似的用户聚集起来,形成若干个用户群组,在每个群组内部
11月23-27日,由中国轻工业联合会党委常委、副会长、中国皮革协会理事长李玉中为组长;四川省皮革行业协会执行会长李开华、中国轻工业联合会综合业务部处长廖小红、中国缝制
由广东省教育学会网络教育专业委员会举办的高峰论坛暨2011年学术年会于12月18-19日在我区顺德一中实验学校隆重举行。此次论坛由顺德区电教中心承办,由顺德一中实验学校协办
随着我国经济进入平稳发展的新阶段,对于专业技能人才的需求日益增加,作为专门培养技能人才的技师学院是职业教育体系中的重要组成部分,其发展价值意义重大。随着各大院校纷
文章结合园林景观设计中常见的生态问题阐述了园林景观设计中生态理念的融合策略,包括加强规划建设前的准备工作、科学合理地选择和应用植被类型、加大对基层工作人员的培养
实验报告是实验教学的一个重要环节,但实验教学中实验报告撰写存在不少问题。文章分析了虚拟实验实验报告中存在的问题,提出了基于初中化学虚拟实验的半自动化实验报告的设计方
小脑幕裂孔疝巩若箴①刘实综述周存升审校①250021山东省医学影像学研究所小脑幕裂孔疝又称小脑幕切迹疝、天幕疝,由Meyer在1920年首次记载。1小脑幕裂孔疝的概念[1]当颅内各个分腔之间存在着压力
随着系统业务复杂度和用户并发量的增加,对系统的要求也越来越高。传统应用架构逐渐失去了灵活性,凸显出难以迭代开发、维护部署等问题。本文将引入微服务架构,通过阐述微服
叔叔、阿姨: 你们好! 我是《新作文》的一名忠实读者,自从我看到它以后我就渐渐喜欢上它了。看完这一期就盼着下一期的到来,一天天魂不守舍。我是在老师的指点推荐下订阅《新
本文采用基于用户协同过滤算法以及基于物品协同过滤算法,通过Scrapy爬虫框架抓取旅游地点信息数据集,以Pycharm为开放环境,Python为编程开发语言,在Python Django Web开发框