基于SimRank相似性度量的图中Top-k查询

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:pingguotailang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,查询与推荐在许多方面发挥着越来越重要的作用,人们需要根据相似性的紧密程度进行推荐,SimRank作为一种常用的相似性度量模型已经被广泛应用于推荐系统、协同过滤、链路预测等领域中。在图中基于SimRank度量的单源点Top-k问题因其广泛应用受到了越来越多的关注。大部分已有算法在解决单源点Top-k问题时面临查询时间和空间效率不高的问题,特别是在比较稠密的图中。所以,需要设计时空高效的单源点Top-k算法。本文提出了两种策略来解决该问题。第一种策略利用局部探测方法来解决单源点Top-k问题,主要通过局部路径枚举并结合剪枝技术来减小探测空间,从而加速求解过程。第二种策略利用蒙特卡洛模拟来解决单源点Top-k问题,设计了新的抽样方法,利用路径抽样来代替路径枚举,高效解决了单源点Top-k问题。具体工作如下:基于局部探测的单源点Top-k算法。该方法主要利用局部探测来避免全局计算,利用SimRank值上界来剪枝探测空间从而加速求解Top-k。首先给出了局部探测Top-k的思想及基础方法,然后进一步提出了高效的LST算法。该算法主要分为两步:第一步,根据待查询顶点的邻域信息生成初始的Top-k候选集;第二步,利用所提出的尚未进入候选集的顶点的SimRank值上界与候选集中顶点的当前SimRank最小值在后续局部探测过程中进行剪枝,减小探测空间。算法的时间复杂度为O(d2l),空间复杂度为O(dl),其中d是图中顶点的平均入度,l是随机游走的最大步长。基于蒙特卡洛模拟的单源点Top-k算法。该方法主要利用路径抽样来代替路径枚举,从而降低计算复杂度。首先提出了LMST-US算法,该算法从待查询顶点出发进行均匀抽样来探测Top-k候选集。然后提出了采用分层抽样的LMST-SS算法,并在其基础上分别提出了利用抽样路径树结构的LMST-Tree算法和利用阈值截断的LMST-δ算法。上述算法的时间复杂度为O(rdl),空间复杂度为O(dl),其中r是抽样数量。该类不同方法在实际中效果不一样,可根据具体情况选择合适的方法。实验结果及分析。实验中首先测试了不同参数对本文提出算法的影响。然后将本文算法与主流的TopSim类算法、KM-SR算法和Sling算法在Top-k查询时间、空间以及准确率等方面进行了比较。实验结果表明,在保证一定准确率的前提下,本文算法在查询时间和空间方面性能优异。在查询时间方面,明显优于KM-SR和TopSim类算法,其中LST算法和需要预处理的Sling查询时间接近,并且在某些数据上优于Sling。在空间方面,本文提出的算法空间占用都较小,特别是基于蒙特卡洛模拟的算法空间占用约为对比算法的10%-55%。
其他文献
城市群是城市区域化和区域城市化过程中出现的一种独特的地域空间组织形式,是城市化达到一定水平的标志和产物,是21世纪参与国际竞争与分工的基本单元。而我国的城市群由于受
随着社会的不断发展,城镇化进程的速度不断加快,大量的农村人口涌入城镇。因此,加强对农民文化素养的培养,对促进我国农业的发展尤为重要。本文主要对新型城镇化背景下的现代
随着时代的迅速发展,国家和社会对人才的培养提出了新的要求,同时,由于高校扩大招生,毕业生供大于求,解决大学生就业压力迫在眉睫。顺应时代潮流,满足国家和社会的需求,大学生创新创
3月4日下午,全国人大代表、内蒙古自治区集宁一中校长李一飞在接受中国教育在线记者采访时表示,一味强化应试教育,会导致学生太缺乏常识,其实现在学生最应该具备的是常识教育。而
党报党刊是党和政府联系人民群众的桥梁和纽带,做好党报党刊发行工作是我国基本国情和政治体制的要求,是适应复杂舆论传播环境、建设公共文化服务体系、推进文化强国建设的要
水性光固化技术因其高效、经济、节能和环保的特性,在生物材料领域备受关注。利用水性光固化技术所制备的光固化生物材料在生物组织工程支架以及骨组织修复领域有着广阔的应用。然而,水性光引发剂的水溶性受限和水性光固化生物材料的力学性能较差,在很大程度上限制了光固化生物材料的实际应用。因此,提高水性光引发剂的水溶性,改善水性光固化生物材料的力学性能具有重要的意义。纳米凝胶具有多功能结构,可调控的尺寸和化学组成
全面预算管理逐渐被企业广泛应用,预算管理也逐渐成为企业对未来经营规划的一项重要管理工具。财务管理在企业管理中有着重中之重的地位,而全面预算管理更像是财务管理过程中
豫西熊耳山矿集区是我国重要的金钼多金属矿集区,而斑岩型金矿、钼矿是该区重要的矿床类型。本文通过磷灰石主微量特征、锆石稀土元素特征,结合前人岩石主微量数据,对花山岩体、雷门沟斑岩体与祁雨沟斑岩体岩石地球化学性质、原始岩浆性质及构造环境进行对比研究,分析其差异性,更进一步剖析岩体成岩成矿作用,为该矿集区找矿提供一些借鉴,取得的认识与成果如下:1、熊耳山矿集区燕山期岩体发育包括:以花山复式岩体为代表的不
本文介绍了EV车型相对于ICE车型在设计阶段NVH差异、易发生的NVH问题及对策。讲解了EV在开发过程中驱动系统、车身系统的开发特点,声学包、异响的开发思路以及轻量化和底盘系
为了解决3M公司的一个新款单组分高粘度结构胶产品中出现的气泡质量问题,本文运用了六西格玛的方法和工具,依照DMAIC流程的方法对该产品进行质量提高的研究。基于六西格玛管