基于模糊集的不确定数据聚类算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:elements17
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的快速发展,聚类分析技术的应用越来越受到人们的广泛关注。聚类分析是无监督学习的过程,根据数据对象的相似性聚集成簇,从而发现数据集中数据的分布规律和发展趋势。现实数据集中存在不可靠、错误、不确定、噪声等属性对聚类分析的结果造成严重的影响,因此,对不确定数据的聚类进行研究具有很高的实用价值,可以使聚类分析结果更加趋于真实化。  本文研究的不确定数据主要是数值型和信息型的属性不确定数据,在对不确定数据的聚类研究中,处理障碍不确定数据和高维不确定数据的聚类是两个无可避免的问题,同时也是两个巨大的挑战。针对以上研究中遇到的问题,本文内容结构如下:  首先,对于传统不确定聚类算法无法有效解决障碍不确定数据的问题,本文对现有的障碍不确定聚类算法进行优化,提出一种基于Voronoi图的障碍空间中密度聚类算法。该方法引入Dev模糊集中的三角模糊数来解决数据的不确定性问题,同时引入R树进行剪枝,降低算法计算量,产生相对精准的数据集。然后根据障碍约束分情况进行分析,提高算法的效率,最后运用基于Voronoi图的密度聚类进行聚类分析,得到更真实准确的聚类结果。  其次,为了对高维不确定数据进行有效聚类,本文利用投影子空间技术进行降维,通过对高维不确定数据进行子空间投影,有效降低无关或冗余属性对高维聚类的影响,并且减少了计算量。同时利用近似骨架理论给出聚类算法的初始解,弥补投影子空间易陷入局部解的问题,避免聚类结果出现局部极值;此外,基于直觉模糊集和相对熵技术提出不确定模糊聚类算法,通过改进的相对熵来有效衡量不确定数据样本间的差异度,保证算法聚类结果的稳定性、全面性、精确性。  通过上述对不确定数据聚类问题的研究,本文最后对论文进行系统的总结,并对论文的研究方向进行展望,为接下来的学术研究定下目标,进行进一步的学习与研究。
其他文献
医学诊断领域,超声成像诊断设备因为其经济实用、无侵袭、无损伤、对人体影响小、低成本、适应性广等优势,在临床诊疗中得到了广泛应用。随着计算机在生活中的普及与软硬件资源
无线自组织(Ad hoc)网络是一种无需基础设施且具有自组织能力的分布式临时自治网络系统。无线Ad hoc网络的易部署、终端可移动、灵活便捷以及可扩展等特性使之具有广阔的应用
本文首先分析配电自动化系统和配变终端国内外研究现状,针对国内现有配变终端存在问题,在对配变终端及相关国家标准充分调研基础上,确定配变终端基本功能及技术指标,借鉴当前国内
更快速地渲染出更具有真实感的人脸,对于虚拟现实,影视娱乐,医学仿真,信息安全等领域都有着重要的意义。因此,实时真实感人脸的渲染技术在应用领域中拥有广阔的前景,其也一直
随着网络社交平台的崛起,海量主观性信息迅速涌现。鉴于这些主观数据往往具有巨大的潜在价值,情感分类、观点挖掘等领域逐渐引起了广泛的关注。然而传统的情感分类具有领域特
微博用户网络是一个涉及普通用户、名人等多类用户要素以及其间关注、推文、转发、评论等多种行为关系的复杂网络,以往对微博用户网络的研究通常仅对一种关系进行讨论,忽略了
随着人们对高速高质量数据传输,以及高容量、大带宽需求的日益增加,每个超级通道以每秒太比特的速率传输成为发展趋势,因此,基于波分复用(WDM)的光网络成为研究热点。在基于波分
光通信网中的传送网和接入网这两个领域目前正朝着高速大容量方向发展,在有限带宽的情况下如何提高通信容量越来越受到关注。偏振复用可以用来提高单根光纤的通信容量,而单载波
为了充分利用彩色成像丰富的纹理细节,及热红外成像在夜视和不良天气条件下的稳定性,应用数据融合的理论和方法,综合热红外与可见光传感器的互补信息,进行图像目标检测。该方法能
生物医学文本中隐含着不断更新的生物医学知识,从这些知识中可以发现基因同疾病之间的关系、基因同蛋白质之间的关系。因此,准确的进行基因名识别是抽取出这些关系的重要前提