一种基于概念的数据聚类模型

来源 :软件学报 | 被引量 : 0次 | 上传用户：weiyuanbin

【摘要】

：

在数据挖掘研究领域，现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制．为了解决这一难题，提出了一种基于概念的数据聚类模型．该模型从描述数据样本的数据本身出发，首

【作者】

：

张明卫刘莹张斌朱志良

【机构】

：

东北大学信息科学与工程学院,东北大学软件学院

【出处】

：

软件学报

【发表日期】

：

2009年9期

【关键词】

：

数据挖掘聚类概念概念元组模型 data mining clustering concept concept tuple model

【基金项目】

：

Supported by the National Natural Science Foundation of China under Grant No.60403041 （国家自然科学基金）, the Key Project of the National ‘Tenth Five-Year-Plan＇ of the Ministry of Science and Technology of Ch

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在数据挖掘研究领域，现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制．为了解决这一难题，提出了一种基于概念的数据聚类模型．该模型从描述数据样本的数据本身出发，首先在预处理后的数据集上提取基本概念，再对这些概念进行概化，形成表示聚类结果的高层概念，最后基于这些高层概念进行样本划分，从而完成整个聚类过程．该模型能够在保证聚类准确性的基础上，彳艮大程度地减少要处理的数据量，提高原算法的可伸缩性．另外，该模型基于概念进行知识的发现与分析，能够提高聚类结果的可解释性，便于与用户交互．实验结果表明，该模型对

其他文献

基于水平集接力的图像自动分割方法

为了实现图像的完全分割,基于无须重新初始化的水平集方法提出了一种接力水平集方法.该方法在待分割图像中自动交替地创建嵌套子区域和相应的初始水平集函数,使水平集函数在其中演化并收敛,然后重复这个过程直到子区域面积为0.与原始算法及经典的基于区域的水平集方法相比,该方法具有如下优点:1)自动完成,无须交互式的初始化;2)多次分割图像,能够比原始算法检测到更多的边缘;3)对于非匀质的图像,能够取得比经典的

期刊

有限差分几何主动轮廓图像分割水平集方法偏微分方程finite difference geometric active contour image

提高无线传感器网络能效的双轮成簇协议设计

提出一种用于提高无线传感器网络能效的双轮成簇协议（energy efficient double rounds clustering protocol,简称EEDRCP）.它对LEACH协议进行改进,以提高网络的能效.它在簇头选

期刊

无线传感器网络能效成簇协议平面型拓扑层次型拓扑基于位置的拓扑wireless sensor network； energy efficiency；

机械工程师基本工程素质培养的瓶颈与改革研究

针对目前合格机械工程师匮乏的现状，从高等工程教育入手，研究了机械工程师基本工程素质培养的薄弱环节及原因之所在，提出了改变现状以提高高等工程教育的质量的主要措施和方法。

期刊

工程素质培养机械工程师高等工程教育改革Engineering education Character Production practices

公平的有向传感器网络方向优化和节点调度算法

为了解决有向传感器网络中点目标覆盖控制问题，分别提出了两种方向优化算法和一个节点调度协议：改进的贪婪（enhanced greedy algorithm,简称EGA）、公平的方向优化（equitable direc

期刊

有向传感器网络多覆盖集效用函数节点调度directional sensor networks multiple cover sets utility

基于IMOM和IBOHM启发式策略的扩展规则算法

基于扩展规则的方法是一种定理证明方法．在IER（improved extension rule）扩展规则算法的基础上，提出了IMOM（improved maximum occurrences on clauses of maximum size）和IBOHM（impr

期刊

定理机器证明命题逻辑扩展规则启发式策略归结theorem proving propositional logic extension rule

从IP路径信息中推导AS边界

基于IP路径信息,从分析AS边界的一般模型入手,引入了AS边界序列的概念,提出了一系列AS边界判别规则,这些规则揭示了IP路径信息中所隐藏的AS边界划分规律.由此提出了一种基于

期刊

计算机网络拓扑IP路径AS边界computer network topology IP path AS border

基于非截断小波有限元的BLT正向问题研究

针对自发荧光断层成像,提出了一种非截断小波有限元算法.该算法采用单元间非截断组合小波基来逼近未知函数,从理论上解决了二维和三维下复杂形状体的剖分,并成功地应用于自发荧光断层成像正向问题中圆柱和圆球仿体的研究.理论分析和数值仿真结果表明,与传统有限元的数值解相比,该算法在获得同样有效解的情况下减少了单元剖分数,降低了计算的复杂度.

期刊

分子影像自发荧光断层成像非截断小波有限元molecular imaging bioluminescence tomography non-trunca

基于Nearest Pair的XML关键词检索算法

随着大量数据以XML格式保存，针对XML文档的关键词检索技术已经成为信息检索和数据库等相关领域的研究热点．以树的杜威编码为基础，分析并证明了XML关键词检索中核心概念SLCA（small

期刊

XML关键词检索最小公共祖先集合XML keyword retrieval SLCA （smallest lowest common ancestor

一种基于概念的数据聚类模型

其他学术论文