扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法

来源 :计算机应用研究 | 被引量 : 4次 | 上传用户:www6331758
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后,利用Diffset策略允许以内存有效方式快速计算项集的加权支持度。实验结果表明,当输入数据库中FWI数较大时,提出的算法明显降低了FWI挖掘时间。相比基于先验的算法,算法平均可节省99.37%的耗时;相比基于位矩阵的加权频繁项集生成算法,提出的算法可节省99
其他文献
针对稀疏子空间聚类(sparse subspace clustering,SSC)和低秩子空间聚类(low rank subspace clustering,LRSC)这两种子空间聚类方法的聚类准确率和稳定性不够高,提出一种基于重建系数的子空间聚类融合算法(reconstruction coefficients based subspace clustering combination algor
传统的演化聚类算法大多是基于单个时间截面进行问题求解,对于多时间截面的融合问题尚无有效的处理办法,造成了大量的知识浪费。从时间平滑框架出发,借鉴组合聚类思想,提出一种基于加权联合矩阵的演化聚类算法(WCEC)。实验表明,该方法不仅简单有效,而且对于数据点变化的演化情况具有较高的扩展性。
在对传统的卫星信号捕获算法分析的基础上,提出了一种惯性导航系统(INS)辅助的基于部分匹配滤波器和快速傅里叶变换(FFT)相结合的捕获算法。在此算法中,利用惯性导航设备提供的信息计算多普勒频率,通过部分匹配滤波器和FFT相结合的算法并行搜索载波频率和码相位。该算法不仅能缩小多普勒频率的搜索范围,而且能够快速搜索码相位。仿真结果表明,此算法能够在高动态环境下成功捕获COMPASS卫星信号,并且明显减
对智能交通系统中面向分布式数据流的频繁模式挖掘问题进行了研究。针对智能交通系统中传感器网络数据流的特点,提出一种基于分布式窗口树的分布式数据流闭频繁模式挖掘方法。该方法在分布式节点中构建分布式窗口树,通过对分布式窗口树进行更新、剪枝及挖掘,能够快速响应用户的查询请求,返回任意时间窗口内数据中的闭频繁模式。实验表明,在保证挖掘准确性的前提下,该方法能够有效缩短查询响应时间,并具有良好的可扩展性。
智能卡具有可以存储用户个人信息、进行低能耗计算的特点,经常被应用于对移动用户的远程认证场景中。针对移动用户和服务器交互的信息在公开信道上传递可能会泄露用户隐私的问题,提出一个不带有双线性对的无证书认证方案。该方案在智能卡与移动设备之间建立绑定关系,避免了智能卡被盗用的危险,同时能抵御伪造和重放等常见攻击。与同类方案比较,在保持安全性的前提下需要更少的计算量和通信消耗。
针对产品制造过程知识效用的定量测度问题,从知识使用过程的角度出发,提出以操作者在自身认知水平下利用知识完成一定难度作业的能力大小来计算知识相对效用。首先,运用主观评价法确定操作者的认知水平,然后引入软件工程领域的图熵理论,利用Petri网对作业过程建模,从中提取出动作结构图和信息结构图,用作业步骤规模复杂度、作业逻辑复杂度和作业信息复杂度表征作业难度,进而采用指标综合加权给出了知识效用的综合测度模
针对多路径路由中如何进行路径选择的问题,综合考虑了节点间能量标准化后的统计参数、路径上的能耗与节点的总能量、路由跳数,提出了多路径的代价函数模型,并提出算法M-EEGR(multi-energy efficient geographic routing)。M-EEGR以贪婪算法选取下一跳并通过DATF算法优化来寻求路径上节点个数的最小化,满足无线多媒体传感器网络(wireless multimed
为了研究传感网络中无线传输的性能特征,引入了一种有限源的重试队列模型。该模型将传感器分成负责通知紧急事件的紧急传感器和负责测量传输环境数据的正常传感器。研究了两种无线信道接入机制下的无线传输性能:在第一种情形下,所有传感器节点都可以随机获得射频传输机会,在第二种情形下,紧急传感器发出的射频传输请求可立即接入无线信道。仿真比较了在这两种情形下请求产生速率和射频单元睡眠周期对响应时间、在轨等待时间和队
由于现有的机会网络转发机制不能完全适应社会网络中基于社交关系的判断与分析,为此通过建立社交关系的分类,构建机会网络中的社会关系树结构模型,提出了一种新的转发机制。该机制设置了节点权重值,由节点所处的层次和社会关系的可利用性及可靠性决定。通过路径权重值,选择最有价值的路径进行消息的传递。通过仿真实验,所提出的转发机制有效地降低了网络中的消息副本数和降低了路由开销。
流数估计是网络管控的重要参考尺度,对网络流量全局特征信息的深入挖掘具有重要意义。针对目前已有的多种估计算法以过度消耗测量设备存储资源和计算资源提高估计精度的缺陷,采用报文抽样技术,提出一种新的迭代收敛型估计算法。实验测试表明,该算法在估计精度和内存消耗上优于EM算法,在迭代更新上优于Iteration算法。