基于非负矩阵分解的聚类集成相关技术

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:ycdyjlc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘的有力工具之一,聚类分析可以在数据类簇特征未知的情况下,将相似度高的对象聚为一个类簇,保证不同类簇之间的对象相似性尽可能小。聚类集成是利用多个聚类结果找到一个新的数据划分,这个划分在大程度上,共享了所有输入的聚类结果对数据集的聚类信息。并且达到博采众长的目的。与单个聚类算法相比较,聚类集成具有鲁棒性、适用性、稳定性的特点,在并行处理子数据集时有先天的优势。黑知识是指在集成学习中,被忽略的隐藏在学习器里的且有利于集成学习的知识。传统的聚类集成方法仅使用基聚类结果中的类簇标签来获得集成结果。而基聚类算法可以获得除了类簇标签外的其他信息,如参数、协方差以及概率等,在集成过程中这些信息都被忽略了,这些知识可以称为聚类集成中的黑知识。本文研究并发展了聚类集成中黑知识的概念及构造方法,并将其应用到聚类集成过程中。利用基聚类结果中的黑知识进行聚类集成,可以提供更多关于基聚类结果的信息,同时也可以防止聚类集成模型受离散数据的限制。非负矩阵分解属于特征提取方法,可以实现将高维数据映射到低维空间,并且被证明与谱聚类方法等价。本文结合黑知识与非负矩阵分解,将其应用到聚类集成中,构建基于黑知识的非负矩阵分解聚类集成模型。实验结果表明,该方法优于其它聚类集成技术。由于在现实聚类任务中,我们时常能获得一些额外的监督信息。半监督技术便是可以利用少量监督信息来指导无监督学习的过程。本文在基于黑知识的非负矩阵分解聚类集成模型上进行改进,提出了基于非负矩阵分解的半监督聚类集成模型。运用高斯核函数以构造基于黑知识的相似性矩阵,然后通过成对约束技术加入半监督标签信息,得到基于黑知识的半监督相似性矩阵,接下来用非负矩阵分解得到聚类集成结果。实验结果表明,基于非负矩阵分解的半监督聚类集成模型比基于非负矩阵分解的聚类集成模型有更好的效果。
其他文献
二阶常微分方程初值问题一直以来都备受学者们的关注。在天体力学、理论物理等科学领域中,经常出现二阶常微分方程模型,它的解经常具有指数形式或者是振荡性,因此对于二阶常微分方程数值方法的研究一直受到国内外很多学者的重视。在二阶常微分方程的研究中许多有效的数值方法被提出,其中Runge-Kutta-Nystrom方法的研究成果非常丰富,此外,属于半隐式方法的Rosenbrock方法和Rosenbrock-
随着信息的快速发展,病案管理中微机的应用已经非常普及和有了长远的发展,病案首页中的疾病分类编目、各种诊断、治疗质量,以及入院、出院等(统称手工索引),已经用微机来完成
"单片机装调与实验"是天津大学电气电子实验中心根据"卓越工程师计划"的要求,通过对传统电子工艺实习课程进行探索而开设的一门新课程。该课程将传统实践课程与单片机实验有机结
受模拟电路人工设计启发,以MOSFET电路为例提出一种模拟电路的自动化设计方法。首先以MOSFET的理想模型为基础,利用遗传算法(GA)产生电路拓扑并优化其参数;然后用实际元件替换其理
本文主要是研究水利工程泵站施工中重点环节的相关技术特点,阐述分析了其施工技术要点。
神经根型颈椎病是颈椎病中最多见的一种类型.颈椎椎间盘突出、椎体后缘及钩椎关节增生均可压迫神经根,主要症状为颈肩部疼痛并沿神经根分布放射至前臂和手指,可伴有麻木感,影
目前我国正处在信息快速发展的网络时代,网络技术的广泛应用逐渐演化出崭新的生产、生活甚至生存的方式。比如足不出户便可以淘宝购物、微信聊天、游戏娱乐等,在此过程中用户
企业内部控制问题在现代企业管理中扮演的角色越来越重要,许多行业因为对内部控制的诸多缺陷管控不到位而付出惨重代价。供水企业是所有现代化城市必不可少的公共服务行业。
结合实验室工作实际,对江苏科技大学以实验室为基地,加强培养学生创新能力所做的探索进行了分析和总结,提出营造自主式学习环境、构建创新型实验内容体系、设置创新实验室、参与