基于密度的空间聚类算法的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jsptpd_dryy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间数据挖掘是指从包含空间信息的数据库中抽取隐含的知识、空间关系或有意义的特征模式。它在理解空间数据、获取空间与非空间数据的内在关系上具有重要意义。空间聚类分析是空间数据挖掘中一个重要的研究方向,它是按照某种相似性度量值,对空间数据集中的数据对象进行归类和标识成簇,使得同簇中的对象尽可能相似,而不同簇间的对象彼此不相似。空间聚类分析既可作为独立的空间数据挖掘工具,又可作为其它方法的预处理方法,目前己经应用在地理信息系统、遥感、医学图像处理、环境研究等领域,具有重要的实用价值。目前,聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优解问题、算法对输入参数的依赖性问题。 该研究对聚类算法的发展现状作了介绍,对现有的聚类算法作了深入的研究,并对其优缺点进行了比较分析。通过对一种基于密度的聚类算法DBSCAN进行分析,针对其 I/O 开销和内存消耗大的缺陷,提出了一种基于可达核心点的聚类算法DRDBSCAN。该算法主要思想是:选择数据库中无任何标识的点进行核心点判断,围绕核心点生成源簇,再对含有共享点的源簇不断合并,从而得到最终结果。通过上述思想,该算法减少了 DBSCAN 算法中需要查询的点的数量,从而克服了DBSCAN 算法 I/O 开销和内存消耗大的缺陷,提高了 DBSCAN 算法的聚类效率。 利用 VC++开发工具实现该算法,并从聚类质量和效率两方面对该算法进行了测试。实验结果表明,本算法具有良好的可扩展性,可以高效地发现任意形状的聚类,不受“噪声”的影响。
其他文献
随着计算机视觉技术的不断发展,立体视觉传感器得到了越来越广泛的应用,尤其是双目视觉传感器以其机构简单、使用方便等诸多优点被成功地用于工业检测、物体识别、工件定位、
跨入21世纪,Internet技术带领信息科技进入了新的时代,越来越多的计算机联入了Intemet。作为当今规模最大的互联网络,它为全世界众多用户提供了多样化的网络与信息服务,它改变了
图像分割是数字图像处理和计算机视觉中重要任务之一。本文研究的基于图论谱聚类分割方法是近几年来的图像分割领域的一个新的研究热点,基于图论的谱聚类基本思想是将一幅图
随着网络技术的飞速发展,网络上的信息量日益增多,网络应用越来越普及,网络安全问题也越来越突出。传统的网络安全技术如防火墙、加密、身份验证等满足不了网络安全的要求,入侵检
一直以来,病理科医生主要依靠自身经验对显微细胞病理切片图像进行分析和判断,并且得出相应的诊断结论。如何实现对切片图像的计算机自动或半自动识别,一直都是一个难以解决的难
随着军事、经济和社会的发展,各种不同类型的网络得到了日益广泛的应用。移动自组网因其固有的特点在诸多领域发挥了巨大作用,但是同固定有线网络相比,无线传输介质、多跳路
无线传感器网络是由大量廉价的传感器节点以自组织的方式构成的网络。在无线传感器网络中,节点协作地感知、监测各种环境信息(例如温度、湿度、压力、污染物浓度等),并将这些
本课题旨在研究数据挖掘技术及其应用,包括对数据挖掘算法的理论研究及数据挖掘技术的应用研究等内容。数据挖掘是兴起于九十年代的一项用于决策支持的新技术。作为数据库中知
跨入21世纪,Internet技术带领信息科技进入了新的时代,越来越多的计算机联入了Internet。作为当今规模最大的互联网络,它为全世界众多用户提供了多样化的网络与信息服务,它改变了
学位