数据流挖掘算法研究

被引量 : 0次 | 上传用户:requst2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,得益于数据采集技术的发展,许多应用中的数据是以流的形式产生的。分析和挖掘这类数据日益成为热点问题。相对于传统的静态数据库,数据流有以下特点:(1)数据量是潜在无界的;(2)数据有很快的到达率;(3)不允许反复扫描历史数据。数据流的特点决定了数据流挖掘必须满足如下基本要求:首先,算法需要及时处理高速到达的数据,因此,算法的计算复杂度要低;再者,有限的内存不可能存储无界的数据量,因此,算法需要保持较低的空间复杂度,维持一个基本的近似空间并在此得到问题的近似解;此外,由于数据流的动态性,算法必须动态调整自身参数以适应数据流的变化。传统的数据挖掘算法很难同时满足以上三个条件,需要对以往数据挖掘算法进行改进或者设计出适应数据流的挖掘算法。近年来,数据流挖掘的研究已取得很大进展,然而,这些新方法仍具有很大的局限性,能够处理数据流的种类也很有限。本文主要工作有如下两个方面:1.本文提出一种高维混合型数据流的可视化算法。在尽量保证数据之间区分度的前提下,算法动态调整参数,把数值型数据和分类型数据分别按照不同方法映射到颜色空间上,由此得到最近一段时间内的颜色矩阵从而作出混合型数据流的视图。2.本文提出基于衰减聚类核心的高维混合型数据流聚类算法。首先,定义聚类核心的概念,并在此基础上利用一种“打靶”的方法判断新数据所属的聚类。针对数值型数据维和分类型数据维,定义不同的聚类核心以及不同的“打靶“方法。算法中,每个参数以及数据结构都随时间而衰减,并根据相应的时间衰减因子进行动态调整。实验表明,该算法能够动态适应数据流的变化并取得良好的聚类效果。
其他文献
聚氨酯化学灌浆材料在建筑物墙体裂缝、地下岩石微细裂隙、混凝土坝体微细裂隙中应用较为普遍,但在穿墙钢套管与钢管之间空腔填充堵漏中的应用较少,尚无相应规范。本文结合南水
杜维明先生的思想植根于儒家人文精神,以思孟心学为根源,提出了以自我主体性为中心的新人文主义,试图反思并转化近代以来在启蒙心态影响下所塑造的社会价值形态。这一宏阔的
肠结核误诊一例报告于莲珍,陈图兴患者女,26岁。因腹痛、腹泻2月余,腹胀1月入院。既往否认结核接触史。体检:贫血貌,腹部膨隆,揉韧感,无压痛,未触及包块,移动性浊音(+)。实验室检查:Hb86g/L,WBC5.4×109/L,粪便潜血
自从上世纪八十年代初在德国发现第一例产ESBLs(Extend-Spectrumβ-Lactamases,超广谱β-内酰胺酶)的克雷伯菌以来,在全球各地不断有ESBLs报道。革兰阴性杆菌是导致感染的最
如何借鉴《联合国反腐败公约》的理念和措施,创新与完善我国反腐败的法律体系和相关机制,是我国法学界所面临的重大课题。我国应明确建立健全预防犯罪、注重实效、加强国际间
金属硅化物Fe3Si基有序合金具有较高的熔点、良好的耐磨性和高温抗氧化性,是一种潜在的高温结构材料。由于这种合金组成元素价格低廉,因此具有较好的工程应用前景。但是,像大多
职业决策困难是职业心理学的一个重要内容,对职业决策困难的研究有利于职业辅导理论与实践的发展。本研究以Gati, Krausz和Osipow(1996)提出的职业决策困难模型为基础,考察大
本文认为,南诏中后期,城镇增加到一百余座,他们的本原是唐城、吐蕃城、境内豪族大姓和部落部族城镇以及南诏自建城镇,其发展既与南诏政治军事力量的膨胀同步,反过来又支撑和
建筑工程的快速发展,促使很多方面的专业工作都得到了行业内的重视。从现有的工作体系来看,地面砖铺贴是建筑工程的细节组成部分,但是在各个方面所产生的影响却是不容小觑的
文化自信是一切自信的根源,而我国博大精深的传统文化则是文化自信的重要基础。在文化自信的大背景下,传统文化开始渗透到现代社会的方方面面。在当前大学英语教学中,传统文