流数据环境下基于k集合覆盖的分布式标签共现算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:stupid199001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析集值属性的标签共现频率,可以挖掘频繁模式以及进行异常的检测。为了提高标签共现计算的性能,提出了一种流数据环境下基于k集合覆盖的分布式标签共现算法。采用多集合的容斥原理对标签共现问题进行了分析,并提出了一种分布式标签共现计算流程;通过引入信息检索中的倒排索引对标签及其出处进行索引,基于k集合覆盖的思想将整个倒排索引划分到多个分布式从节点上,并根据流数据的变化动态地更新每个从节点的局部索引,在对所有从节点的结果进行汇聚后得到最终结果。实验表明,提出的基于k集合覆盖的分布式标签共现算法与其他算法相
其他文献
在线社会网络中,信任关系是用户间进行可靠交互的基础,交互的强度也会影响用户间信任关系的建立。虽然许多研究者对信任建模及其预测进行了研究,但大部分的研究都是基于已有网络进行的,缺乏对用户交互行为及内容的深入研究。在这种情况下,针对原有网络的稀疏性问题和用户交互行为对信任关系的影响进行了研究,提出了一种基于信任网络和用户评分行为的信任预测框架。该框架给出了一种评估用户间交互关系强弱的度量机制,结合用户
近年来,人们设计各类算法来实现协同编辑中的文本一致性维护,而关于Word中图文混排的研究相对较少。对Word中的图片对象和文字对象重新建模、分别存储,以行作为单位设置文档中对象的摆放位置,并通过算法消解各类图片对象与文字对象间的位置冲突,实现图文混排与各站点的一致性。在Co-Word原型系统中增加了图文混排支持,并通过实例分析来讨论策略的执行流程。
微博网站作为一种流行的社交媒体形式,在为用户提供丰富信息和服务的同时,也带来了信息超载问题。如何利用微博网络为用户推荐有价值的信息,以缓解信息超载问题变得日益重要。根
以圆弧梁初参数方程的通解为基础,求得承受任意分布载荷的圆弧梁段的载荷函数,推得反映状态向量变化的传递矩阵式.根据变形协调条件和力的平衡条件推得圆弧梁在弹性支座作用
通过速度超过200 km@h-1条件下客运专线24 m预应力混凝土双线整孔箱梁1:2模型试验和理论计算,分别对该条件下常用跨度预应力混凝土箱型梁在各种荷载作用下的应力和变形进行系
以"动中通"伺服系统为对象,研究了一种基于H_2/H_∞指标的控制器设计方案。在反馈控制器方面,将满足LQ最优准则的扩展状态反馈与状态观测设计整合成一个H_2设计问题,给出理论推导与设计方法;在前馈控制器方面,将扰动抑制H_∞指标设计转换为模型匹配设计,并给出有效求解方法。在控制器参数整定过程中,考虑主谐振模态、不确定性等对系统的影响,给出了一种兼顾动态性能和鲁棒稳定性的整定方法。该设计方法从反馈
根据高速旅客列车安全运行的要求,研制用于轨道状态确认车上的轨道几何检测系统、环境监视系统、限界检测系统及车载局域网系统.轨道几何检测系统采用惯性基准原理、陀螺平台
期刊
针对人工蜂群算法局部搜索能力弱及易陷入局部最优的缺点,提出了一种改进的人工蜂群算法。首先,雇佣蜂使用全局最优引导的搜索策略,且引导程度随个体试验次数(trial)自适应减小,以此平衡算法的全局和局部搜索能力;其次,观察蜂采用变异的异维学习策略,使算法的搜索具有跳跃性,以提高跳出局部最优的概率。对八个经典基准测试函数和CEC2013中八个复合基准函数的测试结果表明,与多种最近提出的类似算法相比,新算