不完整多视图聚类

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:wwf5278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种数据采集手段的增多,真实数据往往呈现多模态或来自多个异构源,形成了多视图数据。而以此数据为研究对象进行机器学习任务称为多视图学习。由于样本标记的费时费力,多视图聚类,作为多视图学习中的重要范式受到了研究者的广泛关注。至今,大多数多视图聚类方法都是基于视图完整的假设。然而,在现实生活中,每个视图数据都有可能产生样本的缺失,这样的缺失使得常规的多视图聚类算法不能直接使用。对这样的数据进行聚类称为不完整多视图聚类,同时也带来了很大的挑战。如何合理地结合多个视图间的互补和一致的信息,减小样本缺失的影响,提高聚类效果则是不完整多视图聚类的目标。本文以此为研究对象,进行了相关聚类算法的研究,并取得了如下研究成果:(1)提出了双对齐不完整多视图聚类(DAIMC)。该算法以加权半非负矩阵分解(Semi-NMF)技术为基础,利用给定样本对齐信息来学习所有视图的公共隐特征矩阵。此外,为进一步减小样本缺失的影响,DAIMC利用L2;1-范数正则化回归建立了一个共享的基矩阵。与现有方法相比,除了继承Semi-NMF处理负值的能力外,DAIMC还拥有两个独特的优势:1)通过为每个视图引入相应的权重矩阵来解决不完整多视图问题,使得它能够容易地适应具有两个以上视图的情况;2)通过回归技术强制各个视图的基矩阵对齐,减少视图不完整对聚类的影响。最后,在四个真实数据集上的实验展示了它的优点。(2)提出了单趟不完整多视图聚类(OPIMC)。至今,虽然已有许多面向不完整多视图聚类的算法,但是它们大多数都是离线的,并且计算和存储成本很高,特别是对于大规模数据集则很难处理。为解决这个问题,本文提出了一种单趟不完整多视图聚类(OPIMC)框架。借助于正则化矩阵分解和加权矩阵分解技术,OPIMC可以相对容易地处理大规模的不完整多视图数据。与现有唯一的方法不同,OPIMC通过引入两个全局统计量,可以直接得到聚类结果,有效地决定迭代过程的终止。最后,在四个真实数据集上进行了大量实验,验证了OPIMC方法的高效性和有效性。
其他文献
随着工业系统复杂性的逐渐提高,越来越多的工业系统表现出多时间尺度特性。在对这些系统进行分析建模时,奇异摄动理论发挥了重要作用,对其展开的研究也逐渐深入。另一方面,很多系统不仅呈现出非线性特性,系统结构参数还会因环境等因素发生随机改变,将Markov跳变理论应用到这类系统的建模中也是一个热门课题。将这两种理论相结合能够极大的改进系统模型的精度,具有一定的实用价值。基于Takagi-Sugeno(T-
中国的诗歌是世界文学艺术中一颗光彩夺目的明珠,是中华传统文化的精髓,在发扬中华民族精神、增强民族凝聚力等方面发挥了重要的作用。脑科学与教育的结合,改变了人们以往对教育的认知,从科学的角度论证学生的身心发展规律与教育的关系,提出了更加符合学生身心发展规律的教育措施。本文从“基于脑科学的高中语文诗歌教学”这一新的视角来探讨高中语文诗歌教学的策略,在研究过程中,通过文献研究法、课堂观察法、访谈记录法等方
当今世界已经步入了一个智能化的大数据时代,数字化技术手段的运用在刑事侦查领域也逐步得到了重视并落实于案件的破获。伴随着大数据本身数据容量大、高速运算、复杂性等特征,使得刑事侦查思维由原本对因果关系的追寻演变为对相关关系的探索。大数据使原本的侦查空间由现实转向了数字化空间,侦查对象也发生了相应变化,这种侦查模式突破了传统侦查落后于犯罪的弊端,间接促使各部门之间信息资源的共享与协作,无疑将侦查推向了智
为了适应用户的流量与服务类型迅猛地增长,新兴的无线网络需要融合成一个强大的网络管理机制来适应网络的灵活性,而无线网络虚拟化技术的出现解决了融合中的技术难题,这也体现出了将虚拟化技术扩展到无线网络中的重要性。本文针对无线环境下的虚拟资源如何进行合理化分配的问题,提出了两种高效的无线网络虚拟化资源分配解决方案。主要工作和创新点如下:首先,无线网络的动态性在虚拟网络映射的过程中容易造成底层物理资源的碎片
近年来,无线通信技术的成熟与物联网技术的普及使人们的生活方式向着智能化方向转变,对室内环境下的智能感知需求日益增长。其中,入侵检测和室内定位技术更是人们的重点关注对象。而随着WIFI信号在全球范围内的广泛部署,利用WIFI实现入侵检测与室内定位可以适用于很多场所。不同于传统的WIFI接收信号强度(RSSI,Received Signal Strength Indication),本文选择能更细致刻
反导系统自诞生之初,便深刻影响着世界的战略平衡与稳定。冷战时期,美苏为夺取战略优势,进行了激烈的反导战略博弈。后两国认识到反导系统对核威慑平衡的破坏作用,展开了反导谈判,并签订了《反导条约》。这在很长一段时间内确保了世界的战略稳定与平衡。近年来,反导技术日新月异,反导系统的性能也发生了变化,具备了攻防兼备的特性。随着反导系统的扩散,反导部署趋向常态化,反导格局也日趋多极化,反导军备竞赛正在蔓延。反
新时代习近平同志基于马克思主义反腐败思想,作出反腐败重要论述,是基于中国具体实际情况的、具备中国特色的反腐败思想,构成习近平新时代中国特色社会主义思想中不可缺少的
口语教学是对外汉语教学的重要组成部分之一,很大程度上影响了汉语学习者的口头交际能力。教学设计是对外汉语教学中一个重要的环节,进行教学设计的目的是能在教学实践前对学习过程和学习资源有一个系统科学的安排。笔者担任泰国东北部乌隆他尼府的Don Bosco Vitthaya School汉语教师长达两年,并负责初中学生汉语口语课的教学工作。本文主要研究泰国初中生中级汉语口语课的教学,根据对外汉语教学理论,
谐振型无线无源声表面波(Surface Acoustic Wave,SAW)传感器通过谐振回波信号频率的提取能实现远距离无线无源参数的测量,并且该传感器能用于高温、低温、高电压、高加速度、强腐蚀性、强电磁场等复杂环境。这些优点的存在,使得SAW无线测量技术备受关注。随着SAW无线测量技术的发展,出现了很多难以解决的问题,主要有:(1)无源SAW传感器回波信号能量低,有效信号持续时间短,且工作环境复
本设计的核心为电源与驱动的整合设计,其最大的优点是提高了电源的效率,本技术实现了很多的创新,如:超薄设计,低待机功耗,节能环保等,技术上的优势为其推广应用奠定了基础。