基于SOM算法改进的K-medoids算法及其研究

来源 :太原理工大学 | 被引量 : 8次 | 上传用户:velvet_flower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的飞速发展,引起信息的急剧膨胀,给计算机存储和行业数据库带来巨大挑战。随着数据指数级的增大,维度不断加大,数据类型的复杂度也在不断提升。对于这些超高维数据,需要通过数据挖掘技术来探索隐藏于数据内的信息并利用获取的信息辅助我们做出科学合理的预测与决策。常见处理高维数据方法有:数据降维、聚类分析、回归分析等。本文介绍了传统的自组织映射(SOM)神经网络和K-medoids算法。传统的SOM算法在使用时,存在部分样本点和对应的权向量之间差距较大,造成聚类的准确性较低;K-medoids算法在聚类前需要人为确定聚类个数和初始中心点,而不同的聚类个数和初始中心点的选择会造成不同的聚类结果。为弥补以上两种方法的不足,本文提出一种自组织映射(SOM)神经网络与K-medoids算法结合的算法——改进的SOM-K算法。文中,第一章详细描述了大数据背景下,聚类和降维算法的研究意义;第二章主要讲述了基于聚类算法距离的定义;第三章主要阐述传统的K-medoids算法和SOM算法;第四章主要说明了本文提出的基于SOM算法与K-medoids算法的改进聚类算法并比较了传统的K-medoids算法、SOM算法和SOM-K算法对鸢尾花数据集的聚类结果,证实了 SOM-K算法是优于传统的K-medoids算法和SOM算法的一种算法;第五章用SOM-K算法对于全国水资源分布进行聚类分析并结合分析结果给出详细的结论阐述;第六章进行总结与展望,阐明改进算法的优势与不足,以便后续继续学习与探究。
其他文献
<正> 目前,我国涉外经济合同法和民法通则已就合同准据法的确定规定了相应的冲突规则。一国的冲突法规固然属于国内立法范畴,但是它既然以调整涉外民事关系为己任,那么在其立
本文回顾了近20年来国内外对教师知识的研究。首先分别阐述了教师知识研究在研究内容和研究路径上的两种取向,接着分析了当前实践性知识研究所关注的焦点问题以及我国实践性
政协第十二届全国委员会常务委员会第二十三次会议于2017年10月31日下午举行全体会议,14位全国政协常委、委员围绕"学习贯彻中共十九大精神"作大会发言。全国政协主席俞正声
2010年-2011年瓦斯事故出现反弹,一般事故、较大事故、重大事故数量同比均出现上升,特别是重大事故起数和死亡人数成倍增加。河南、湖南、贵州、四川、重庆等几个省市的较大以
三氟甲基芳基硫醚由于具有高疏水性和亲脂性,在医药、农用化学品及材料科学中有着重要的应用。合成含三氟甲硫基的芳香化合物已成为有机氟化学领域的研究热点之一。本文从间
电子商务作为一种新型网上在线贸易方式,使企业与消费者摆脱了传统的商业中介的束缚,但是电子商务交易中最为重要的环节--网上支付,其安全问题依然是阻碍电子商务快速发展的
本文以"公共性"与"民主主义"为学校改革的基本原理,提出将学校创建为"学习共同体"的改革理念和方略,即在学校中构筑相互学习的同事关系、在课堂中构筑相互倾听和对话的关系,
<正>随着现代生产技术和交通工具的发展,噪声污染已经与大气污染、水污染一起并列成为世界3大公害,越来越引起人们的重视。噪声除了特异性地引起听觉系统损害外,还影响神经系
随着社会竞争的加剧,如何有效提升绩效成为每个企业最为关注的问题。对于企业而言,诸多方面的竞争归根结底是人才的竞争。采取何种措施有效激励并留住人才,对现代企业绩效的
自农村信用社开展改革试点工作以来,其经营状况明显好转,在支农资金实力、产权制度方面也取得了一定成绩,与此同时也暴露出不少问题。本文以江苏省农村信用合作社为研究对象,