基于超限学习机的聚类算法研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:wenjun_wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类技术作为数据分析中的重要手段,在信息爆炸的现代生活中变得越来越重要。为了获得符合常识的信息,人们对数据进行总结和归纳,利用自身的经验将数据聚类为知识。如今,在各个领域都产生了大量且复杂的数据,对一些领域的信号进行分析的复杂度远远超出了人的分析能力,这就使利用机器代替人工分析数据成为亟待解决的问题,也是人类智慧向人工智慧的跨越。人工神经网络是以大脑神经元为原型的数据分析算法,其与聚类技术的结合将使聚类技术更加符合数据内在的规律,进一步提高聚类算法的性能。为了探索人工神经网络与聚类技术相结合的方式,本文进行了如下研究工作:首先,本文回顾了聚类技术的发展历程,在分析聚类算法所涉及相关技术的同时,寻找人工神经网络与聚类技术相结合的切入点。通过总结各种聚类算法及人工神经网络的联系与区别,本文发现超限学习机模型拥有能够契合迭代式聚类算法的特点,并尝试将其与经典的迭代式聚类算法——K均值算法相结合。其次,为了研究超限学习机模型与K均值算法的结合方式,提出了一种基于K均值算法迭代聚类框架的模块化描述。通过划分和拓展K均值算法的步骤,归纳出包括特征空间映射、初始化聚类中心、相似性函数、聚类中心更新以及判断终止条件这五个关键模块,并阐述了实现各个模块的技术方案。接着,本文具体描述了超限学习机模型与K均值算法的结合方案,提出基于超限学习机的聚类算法(K-Extreme Learning Machines Clustering,KELMC)。为了使得该方法能够适应不同的数据环境,本文依据前面提及的各模块实现方案,提出了两种针对KELMC算法的优化策略,即基于ELM-AE与PCA特征空间的KELMC算法和半监督流形学习的KELMC算法。最后,本文分别在人工数据集和UCI数据集上对所提出的三种方法进行了聚类性能的分析与验证,并在实验过程中讨论了所提出方法的参数选择问题。实验结果显示,本文提出的KELMC算法将超限学习机模型与聚类技术进行了有效结合,并在多数数据集上获得了较好的聚类效果,具有较强的适应与泛化能力。
其他文献
互联网中信息规模的爆炸式增长,满足了用户对信息的需求。但庞大的信息量使得用户难以快速定位到有用信息,降低了信息的使用率,导致了信息过载问题的出现。个性化推荐技术是一种
随着系统复杂度的不断提高、系统对硬件的依赖程度的增加以及客户对程序的安全性、可靠性等要求的提升,传统的离散建模工具已经越来越难以满足软件工程师对于系统建模的需求
随着肝脏切除手术及肝脏活体移植手术需求的不断增长,肝脏自动分段越来越受到关注。肝脏内主要的几套供血系统走向确定了肝脏的分段,肝脏自动化分段主要依据于较为成功,受到较普
随着计算机安全技术的发展,可执行文件的比较技术不断应用到软件版权保护、系统补丁分析、电脑病毒研究、计算机漏洞检测等领域中。由于软件的封闭源码特性导致源代码比对方
随着移动互联网的普及和移动互联设备的深入应用,高校师生对移动应用的需求也日益增长,迫切需要一个安全、便捷、丰富的集成化移动服务环境,满足师生随时随地利用移动终端方便快
学位
面部表情在人与人之间的交流上有重要的作用,人脸表情相对文字、语音等媒介在表达人的情感、情绪方面具有更加直观、准确的优势。将自然人这种情感交互模式用于如虚拟远程教
在计算机技术飞速发展的今天,基于网络环境的各种应用系统层出不穷,这些应用系统大多都要针对大量的数据进行处理。在早期的开发过程中,人们对于不同应用系统间共享数据未予关注
基准剂量评估通过把实验获得的剂量——反应数据和数学模型拟合推导健康风险评估的起点,是一种统计学意义上的风险评估方法。首先研究了基准剂量计算的实验设计。目前进行剂
随着网络信息的快速增长,搜索引擎的作用越发的重要。而为了进一步处理和挖掘网络日渐增长的庞大信息,搜索引擎本身也相应地要寻求某些除了简单的网页文本以外的载体。网络表格