流数据Top-K关键字查询算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ppaann850729
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Spark Streaming计算框架的分布式Top-K关键字查询是统计流数据中所有关键字的热点研究问题。多数研究通过限定存储空间来实现Top-K关键字查询,并假设关键字集合已知。针对这个问题,提出一种可应用于关键字集合未知情况的分布式Top-K关键字查询算法,根据监测到的关键字动态地调整存储空间,通过更新策略的优化提升其精度。实验结果表明,该算法的性能在关键字集合未知的情况下比现有算法更优。
其他文献
模式层知识对于语义万维网的发展非常重要,然而当前开放链接数据(LOD)中模式层知识的数量十分有限,为突破这一局限,提出一种基于社交网络中用户自描述标签的层次分类体系构建
OpenFlow协议是SDN网络中控制平面与数据转发平面之间进行交互的规范与标准,其正确性将直接影响到整个网络功能的实现。通过模型检测技术实现一种验证OpenFlow协议正确性的形
摘要:当今社会已经进入了一个全新的信息时代,这个时代对教育提出了更高的要求,要达到这样的高要求,继续沿袭以前的教学模式肯定是不行的,必须在教学策略方面有新的突破与创新,而信息技术给我们提供了一个良好的机遇,它不仅为学习者和教学者提供了各种可供选择的资源,还将带来教学的大变革。因此,在教学中应用信息技术是教育发展的必然趋势,而在小学体育教学中应用信息技术目前已经迫在眉睫。关键词:体育教学;信息技术中
学高年级数学是升初中的转折点,在教学中培养学生的自主学习能力是十分重要的。在教学过程中,学生若能主动接受知识,所取得的学习效率要比被动学习的效率高出许多。高年级的
目的:制图周围神经43kD蛋白单克隆抗体,并检测该蛋白在正常及损伤坐骨神经中的表达,方法:实验用SDS-聚丙烯酰胺胺凝胶电泳系统,从周围神经中分离回收43kD蛋白作为抗原,免疫BALB/c小鼠
目的探讨施万细胞条件培养基对大鼠骨髓间质细胞的诱导分化作用.方法从大鼠骨髓中分离培养间质细胞并传至第6代,诱导前24 h加1μg*L-1碱性成纤维生长因子(bFGF)入培养液中以
新冠肺炎疫情突如其来,通过回顾近代以来具有代表性的六次重大疫病冲击,总结梳理中国公共卫生治理机制对于历次重大疫病冲击的反应与调整。近代中国在抗击疫病中坚持以人为本
针对WSN中利用可移动中继节点进行数据收集的问题,提出了一种基于区域划分的数据收集策略。该策略首先利用CPSA算法选择网络中的中心节点,以减少可移动中继节点经过的止点数
目的观察caspase-3 mRNA反义寡核苷酸(ASODN)对HL-60细胞凋亡的抑制作用,筛选有效ASODN。方法用脂质体介导法将针对caspase-3 mRNA不同序列的4条ASODN导入HL-60细胞中,γ-射线照
综合利用JT1、CS1等钻井资料,结合露头剖面及地震资料,研究四川盆地川中古隆起寒武系沧浪铺组下段沉积格局、生储盖空间配置及古隆起演化特征,揭示有利勘探区带。沧浪铺组下