【摘 要】
:
频繁模式挖掘是数据流挖掘中的重要研究课题.针对数据流的时效性和流中心的偏移性特点,提出了界标窗口模型与时间衰减模型相结合的数据流频繁模式挖掘算法.该算法通过动态构
【基金项目】
:
国家高技术研究发展计划(863计划)(2006AA01Z451 2007AA01Z474)资助
论文部分内容阅读
频繁模式挖掘是数据流挖掘中的重要研究课题.针对数据流的时效性和流中心的偏移性特点,提出了界标窗口模型与时间衰减模型相结合的数据流频繁模式挖掘算法.该算法通过动态构建全局模式树,利用时间指数衰减函数对模式树中各模式的支持数进行统计,以此刻画界标窗口内模式的频繁程度; 进而,为有效降低空间开销,设计了剪枝阈值函数,用于对预期难以成长为频繁的模式及时从全局树中剪除.本文对出现在算法中的重要参数和阈值进行了深入分析.一系列实验表明,与现有同类算法MSW相比,该算法挖掘精度高(平均超过90%),内存开销小,速度上可
其他文献
面向对象编程是确保大型电力系统分析和应用软件易于维护、升级和移植的有效方法.简述了面向对象(Object-Oriented)的软件设计思想,讨论了面向对象编程中的几项核心技术,并将
着重论述了电力负荷预测中建模变量的选择、数据的预处理方法、模型的拓扑结构及其对预测精度的影响。针对水电企业电力负荷预测,提出了一种将经典的AR模型与T-S模糊神经系统
随着300mm晶圆的加工技术问世,工业界开始采用一种全新的晶圆制造设备一集束型设备群(Multi-cluster tools)。对于单个集束型设备(Single-clustertools)调度研究已比较成熟,并提出
传感器零点的长期稳定是一项重要的技术参数指标。影响传感器零点误差的因素包括粘贴工艺、弹性体设计、温度等。针对应变式扭矩传感器内部电阻磨损对零点造成的误差进行研究
民间纠纷激化为治安案件、刑事案件或者形成长期上访案件,一个不可忽视的原因是信息不灵、调解介入不及时所致。为借助现代信息技术,弥补工作缺陷,河北省石家庄市栾城区司法
为了实现降钙素原(PCT)蛋白在大肠杆菌中高效表达,对PCT的编码基因序列进行优化,通过化学方法合成优化后PCT基因,并将其克隆到p ET28a(+)载体中,构建重组质粒p ET28a(+)/PCT,转化到大
在阿深高速公路开封黄河大桥初步设计阶段,通过对各种方案进行比选,最终推荐部分斜拉桥方案。在方案比选过程中,对各方案进行的详细分析和比较,可为同行提供参考。
针对油田开发中地层能量失恒导致的油田难以维持长期高产、稳产的问题,探讨了一种基于仿人智能的油田地面注水系统控制策略。剖析了注水驱油开采方式的优势及存在的问题,总结
针对一阶不稳定加延迟对象,基于传统稳定裕度定义的PI控制整定方法缺乏对幅值裕度下边界的考虑,使得结果与实际有一定偏差.通过对延迟环节的逼近,得到更精细的可达稳定裕度区
针对平面布置不规则结构的规范相关条文,利用PKPM软件建立一系列平面布置不规则结构模型,探讨在一定高度条件下,不同扭转刚度对位移比参数影响的统计规律,为保证建筑结构的整体稳