基于迁移学习的模糊聚类算法研究

来源 :济南大学 | 被引量 : 0次 | 上传用户:yyxgxgxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘领域,聚类算法因其具有简单、灵活、高效等优势,被广泛用于各种数据挖掘任务中。但当聚类数据不足时,传统聚类算法很难取得较好的聚类结果。随着机器学习技术的发展,迁移学习方法已被成功用于解决数据不足导致的训练效果差的问题。该方法通过从训练效果好的模型提取信息,应用到目标数据中,以提升目标数据的训练效果。借鉴迁移学习的思想,迁移聚类方法被提出用于解决相关数据聚类的问题。迁移聚类就是将源域数据的知识加入到目标域数据的聚类过程中,以获得目标域数据的更好分割。围绕迁移聚类,本文对现有的集中式聚类和分布式协同聚类方法进行改进,以提升相关算法的聚类效果。主要的创新性工作和成果如下。1.改进集中式聚类方法,提出面向高维数据的基于迁移学习的属性熵加权模糊聚类算法(TEWFCM)和面向非线性数据的基于迁移学习的核模糊聚类算法(TKFCM)。应用迁移学习技术,将源域数据的类中心及维度权重迁移到目标域数据中,辅助目标域数据的聚类。实验测试结果表明迁移技术可以有效地提升属性熵加权模糊聚类算法(EWFCM)和核模糊聚类算法(KFCM)的聚类效果。2.改进分布式协同聚类方法,提出基于迁移学习的分布式协同模糊c均值聚类算法(TCFCM)和基于迁移学习的属性熵加权分布式协同聚类算法(W-TCFCM)。在传统的分布式协同聚类算法中增加网络相邻节点间的迁移学习项,以加速聚类过程的收敛和提升聚类效果。实验结果显示相比传统的分布式协同模糊聚类算法Soft-DKM和CDFCM,改进算法能够获得更高的聚类准确度和更少的聚类迭代次数。3.进一步改进基于迁移学习的分布式协同聚类算法以增强算法的普适性。在上述基于迁移学习的分布式协同聚类算法中,一个重要的超参数就是学习因子,它是一个全局量,表示了网络相邻节点间学习的程度,其取值通常需要人工预先设定。实验结果发现算法聚类效果受学习因子的取值影响很大,这将大大降低算法的普适性。为此,本文设计了学习因子自动调整方法,并提出基于迁移学习自调整的分布式协同模糊c均值聚类算法(A-TCFCM)和基于迁移学习自调整的分布式协同属性熵加权聚类算法(AW-TCFCM)。这两种算法将全局学习因子改为在每对相邻节点间设定学习因子,并根据前后两次迭代中邻居节点群中心的变化趋势以及在同一次迭代中相邻节点间的中心差异,实现相邻节点对的学习因子的调整。实验结果表明改进算法能够获得更加稳定的聚类结果,受学习因子初始值的影响较小。
其他文献
图像采集设备和网络通讯技术的进步以及图像处理技术的发展,使得图像逐渐成为通信的重要载体。但也给不法分子带来了可乘之机,如果在新闻报道、法庭取证、保险理赔、国际事务
恶意软件是在计算机系统上执行恶意任务的程序。随着互联网技术的发展,恶意软件攻击的频率呈指数级增长,恶意攻击已成为威胁互联网安全的关键所在。恶意软件的检测方法对于防
我国民航旅客运输量在近年来不断攀升,这给机场航站楼的管理带来了巨大的压力。传统监控系统需要人工监测,非常耗时耗力,难以满足航站楼安全管理的需求。因此,智能监控技术的
随着全球经济一体化的发展,国家与国家之间的贸易量日益增长,国际航运业的发展越来越重要。因此,航运业受到人们的广泛关注。通过合理规划航线,使船舶按照预期航线航行,可以
航空发动机涡轮叶片作为发动机的核心零件,其性能的优劣直接影响着发动机的空气动力性能以及使用寿命。为了最有效的利用发动机叶片的性能以及降低叶片的制造成本,在发动机叶
在社交网络中,用户不仅充当信息的接收者,还充当信息的生产者和传播者。这使得信息可以在在线社交网络快速传播,以至于短时间内影响很多人。现如今,随着各大在线社交网络用户数量不断增加,在线社交越来越成为人们生活的一部分。在社交网络研究分析中,影响力最大化(Influence Maximization,IM)问题是其中一个非常热的研究方向。在现实生活中社交网络的IM问题具有重要的研究意义,通常被应用于病毒
乳化炸药是民爆行业中最受欢迎的炸药,它广泛用于各类工业爆破作业中,随着乳化炸药生产量的逐年增加,对它的质量要求也越来越高,质量的好坏直接体现在乳化炸药的稳定性上。乳
随着计算机技术的快速发展,图像识别技术也在不断的发展与完善。图像自动识别技术早已应用在了生产生活中的各个领域,将人从一些重复、机械的工作环境中解放出来,大大提高了
在控制领域中,高阶非线性系统的控制是许多科研工作者们关注的一个热门领域,该方向的研究已经走向多元化和交叉学科方向发展。本文主要研究了两类带有不确定性的高阶非线性系
安全监测是大坝管理的核心,也是不可或缺的一部分。若不对运行中的水库大坝进行周期性的检查和观测,不能够得到其运行状态的变化,不仅会使水电站的经济效益下降,还会影响库区