一种基于概念的数据聚类模型

来源 :软件学报 | 被引量 : 0次 | 上传用户:weiyuanbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,彳艮大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对
其他文献
为了实现图像的完全分割,基于无须重新初始化的水平集方法提出了一种接力水平集方法.该方法在待分割图像中自动交替地创建嵌套子区域和相应的初始水平集函数,使水平集函数在其中演化并收敛,然后重复这个过程直到子区域面积为0.与原始算法及经典的基于区域的水平集方法相比,该方法具有如下优点:1)自动完成,无须交互式的初始化;2)多次分割图像,能够比原始算法检测到更多的边缘;3)对于非匀质的图像,能够取得比经典的
提出一种用于提高无线传感器网络能效的双轮成簇协议(energy efficient double rounds clustering protocol,简称EEDRCP).它对LEACH协议进行改进,以提高网络的能效.它在簇头选
针对目前合格机械工程师匮乏的现状,从高等工程教育入手,研究了机械工程师基本工程素质培养的薄弱环节及原因之所在,提出了改变现状以提高高等工程教育的质量的主要措施和方法。
为了解决有向传感器网络中点目标覆盖控制问题,分别提出了两种方向优化算法和一个节点调度协议:改进的贪婪(enhanced greedy algorithm,简称EGA)、公平的方向优化(equitable direc
基于扩展规则的方法是一种定理证明方法.在IER(improved extension rule)扩展规则算法的基础上,提出了IMOM(improved maximum occurrences on clauses of maximum size)和IBOHM(impr
基于IP路径信息,从分析AS边界的一般模型入手,引入了AS边界序列的概念,提出了一系列AS边界判别规则,这些规则揭示了IP路径信息中所隐藏的AS边界划分规律.由此提出了一种基于
针对自发荧光断层成像,提出了一种非截断小波有限元算法.该算法采用单元间非截断组合小波基来逼近未知函数,从理论上解决了二维和三维下复杂形状体的剖分,并成功地应用于自发荧光断层成像正向问题中圆柱和圆球仿体的研究.理论分析和数值仿真结果表明,与传统有限元的数值解相比,该算法在获得同样有效解的情况下减少了单元剖分数,降低了计算的复杂度.
随着大量数据以XML格式保存,针对XML文档的关键词检索技术已经成为信息检索和数据库等相关领域的研究热点.以树的杜威编码为基础,分析并证明了XML关键词检索中核心概念SLCA(small