基于CAPE的数据流分类算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zhuyong006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、数据库技术、计算机网络技术的不断发展,一种区别于传统数据库存储的数据形式出现,称之为数据流。针对数据流的挖掘方法成为了近年来的研究热点。分类作为数据挖掘中重要的一个分支,在数据流挖掘中也扮演着重要的角色。由于数据流具有数据持续到达,到达速度快,数据规模大等新的特点,传统的基于静态数据的数据挖掘分类方法,比如贝叶斯、决策树,神经网络等等,已经无法满足数据流挖掘的需求,为了适应数据流的新特点,本文采用了基于频繁模式的分类方法,即先挖掘出初始窗口中的频繁模式,并以此作为分类器,然后随着数据的不断到达对分类器进行动态的更新并通过此分类器对到达的数据进行分类。通过对已有频繁模式挖掘算法和分类算法的学习和归纳,认真的分析了算法CAPE在分类过程中的缺点和不足,对算法在分类器建立过程、分类器存储结构和分类器更新过程上进行改进,得到新的基于频繁模式的数据流分类算法FPBC。新算法采用了频繁模式树作为数据流分类器,利用模式缓存表来解决概念漂移的问题,通过实验证明算法在系统内存占用和分类精度方面都有很大的提高,为数据流挖掘的分类研究注入了新的思路和方向。
其他文献
随着专利文献类别和数量的迅速增长,专利管理系统急需解决快速文献分类及高效、高质的专利检索等问题。在传统的专利管理系统中,分类是系统的基本功能,也是影响系统性能的关
在特种电影的制作过程中,图像的畸变校正、拼接、融合一体化是一个重要部分。本文重点研究了一体化过程中的图像畸变校正部分。本文在总结已有的图像校正方法的基础上,提出了
超常介质是一种新型的人工合成材料,它具有许多自然材料所不具备的独特的电磁特性。随着超常介质从微波到红外甚至光波段的实现,对电磁学、材料学、光学、电子学、通信等学科
汉字作为一种世界上最古老,并唯一流传至今的形意文字,已有六千年历史了。作为我们日常使用的语言文字,其具有数量巨大,结构复杂,相似字多等特点,因此手写汉字识别体现了模式
随着计算机网络和数据库技术的发展,在企业信息化建设和管理的过程中,异构数据库的应用越来越广泛,于是人们就提出了共享分布在不同地理位置上的异构多数据库信息的要求。异
图像压缩算法一直以来都是一个非常热门的研究领域,经过多年的研究,已经有了很多成熟的图像压缩技术。在图像处理领域,小波变换对信号的时、频局域的分析能力很强,所以它一直
实时系统主要面向现实世界中与时间因素相关的应用需求,在工业控制、航空航天和军事设备等众多领域里有着广泛的应用。它所关注的不仅是计算结果在逻辑上的正确性,而且还有输
开发web应用系统需要解决很多复杂问题,因此我们需要借助于第三方的开发平台,比如Java EE,来降低开发成本。遵循Java EE规范的Java EE框架,为一些web应用中的常见的问题提供了解
支持向量机是Vapnik等人提出的一种新的机器学习方法,它基于统计学习理论,借助最优化方法来解决机器学习问题,体现了统计学习理论中的结构风险最小化思想。但是在实际应用中,
21世纪高校的竞争归根结底是人才的竞争,民办高校作为近20年来我国重要的一种新兴教学体,人事管理在其发展中起着举足轻重的作用。人事工作的优劣对于民办高校人才吸引、师资