高维数据流的自适应子空间聚类算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户：gcj820305

【摘要】

：

高维数据流聚类是数据挖掘领域中的研究热点。由于数据流具有数据量大、快速变化、高维性等特点，许多聚类算法不能取得较好的聚类质量。提出了高维数据流的自适应子空间聚类算

【作者】

：

任家东周玮玮何海涛

【机构】

：

燕山大学信息科学与工程学院,北京理工大学计算机科学技术学院

【出处】

：

计算机科学与探索

【发表日期】

：

2010年9期

【关键词】

：

高维数据流子空间聚类数据流流量自适应 high-dimensional data stream subspace clustering data ra

【基金项目】

：

The Natural Science Foundation of Hebei Province of China under Grant No. F2010001298（河北省自然科学基金）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高维数据流聚类是数据挖掘领域中的研究热点。由于数据流具有数据量大、快速变化、高维性等特点，许多聚类算法不能取得较好的聚类质量。提出了高维数据流的自适应子空间聚类算法SAStream。该算法改进了HPStream中的微簇结构并定义了候选簇，只在相应的子空间内计算新来数据点到候选簇质心的距离，减少了聚类时被检查微簇的数目，将形成的微簇存储在金字塔时间框架中，使用时间衰减函数删除过期的微簇；当数据流量大时，根据监测的系统资源使用情况自动调整界限半径和簇选择因子，从而调节聚类的粒度。实验结果表明，该算法具有良好的

其他文献

数据挖掘在电子商务中的应用研究

电子商务是利用计算机网络技术和远程通信技术，实现电子数字化和网络化商务运行的过程。信息技术的发展，促进了数据挖掘技术的研究与应用，随着现代电子商务的拓展和运行，作为一种

期刊

数据挖掘电子商务应用研究

MPSQAR：无损语义的量化关联规则挖掘算法

在挖掘量化关联规则的过程中，由于对量化值的划分，将产生语义损失。为避免这种情况，提出基于无损语义的算法MPSQAR来处理量化关联规则的挖掘。主要工作包括：（1）提出规泛化量化值的

期刊

量化关联规则MPSQAR算法语义信息损失quantitative association rule MPSQAR algorithm loss of

中国人口控制的理论分析

自从20世纪70年代初推行计划生育政策以来，我国在人口控制方面已经取得了举世瞩目的伟大成就，人口开始进入在一定制约条件下的低增长时期。我国是世界人口大国，为了保证国民经济

期刊

中国人口控制计划生育人口问题人口素质人口质量综合治理

峰山应急水源水质取样方法的比较分析

本文主要针对峰山应急水源在水质分析取样时，就代表性及实践操作性方面进行了多种取样方法的分析比较，并就雨季启动峰山应急水源加密检测频次进行了阐述分析。

期刊

峰山应急水源取样方法

改进视皮层视觉机制的视觉注意力模型

人类的视觉注意机制是人类大脑感知事物的最直接的功能。提出了一种基于视皮层视觉机制的生物激励注意模型。利用HMAX(hierarchical maximization)模型的四层机制中的C1细胞单元图,构造独立成分分析(independent component analysis,ICA)滤波器组,进一步利用对尺度、平移等均具有不变性的C2细胞特征,以及香农熵理论,共同构造用于视觉显著性区域检测的测

期刊

视觉注意机制显著性图视皮层HMAX模型人类视觉信息处理系统visual attention mechanisms saliency map vis

多维空间索引结构SHG-Tree

R-Tree及其变种的多维索引结构在数据的操作过程中通过对空间的分隔和不断调整将整个空间划分为大小不等的子空间以容纳足够的空间对象，这种方法能有效地实现多维空间对象的索

期刊

空间索引空间超立方格子树对象线性化spatial index spatial hypercube grid tree （SHG-Tree） line

C—Rank：一种Deep Web数据记录可信度评估方法

针对Web信息可信度问题，提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S—R可信度网络，包含两种类型顶点及三种类型边。首先基于可信

期刊

深层网络Web信息可信度S—R可信度网络可信度传播Deep Web Web information credibility S-R credibil

高维数据流的自适应子空间聚类算法

与本文相关的学术论文