深度多视图子空间聚类方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:tlihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种新兴的无监督方法,多视图聚类为研究多视图数据中的隐藏结构提供了一种好方法,并在机器学习和数据挖掘领域引起了广泛关注。一种流行的方法是识别用于捕获多视图信息的公共潜在子空间。但是,由于无监督的学习过程,这些方法仍然受到限制,并且它们受到来自不同视图的大量噪声信息的困扰。另外,还存在未考虑视图重要性差异的问题。本文从多视图子空间聚类的角度入手,针对上述两个问题,开展自监督深度多视图子空间聚类方法研究、自加权自监督深度多视图子空间聚类方法研究。本文的主要创新点如下:(1)针对当前多视图聚类方法受限于无监督学习过程、多视图数据包含大量噪声信息问题,我们提出了一种新颖的多视图子空间聚类方法,称为自监督深度多视图子空间聚类(Self-supervised deep multi-view subspace clustering,S2DMVSC)。它将谱聚类和相似性学习无缝集成到深度学习框架中。S2DMVSC有两个主要优点。一个是可以充分利用聚类结果来监督每个视图的潜在表示学习(通过一个分类损失)和多个视图的公共潜在子空间学习(通过一个谱聚类损失)。另一个是数据对象之间的亲和度矩阵是根据高层的类簇驱动的表示自动计算的。在包括原始特征和多种人工特征在内的两种场景下进行的实验证明了所提出的方法相对于最新对比算法的优越性。(2)针对大多数多视图聚类方法未考虑视图重要性差异、假设所有视图重要性一致问题,我们提出了一种新颖的基于自监督深度多视图子空间聚类的自加权多视图聚类方法,被称为自加权自监督深度多视图子空间聚类方法(Self-weighted self-supervised deep multi-view subspace clustering,S3DMVSC)。为了更好地衡量不同视图的重要性差异,通过一种巧妙的方式,它可以在不引入额外超参数的前提下自动为每个视图分配一个权重。另外,S3DMVSC中的由聚类结果产生的自监督信息可以有效地监督每个视图的潜在表示学习(通过分类损失)和所有视图的公共潜在子空间学习(通过谱聚类损失)。一系列实验证明了所提出的方法相对于最新对比算法的优越性。
其他文献
在我国创新驱动和供给侧结构性改革的背景下,债券市场存量增大,企业面临扩张风险和融资风险,债券市场打破刚性兑付现象频繁发生,其违约风险越来越受关注。结合大数据和人工智能背景,在债券市场上建立科学的违约预警模型有助于整体利益最大化,实现市场经济的健康发展。通过阅读国内外学者的研究发现,现有债券违约风险预测模型较少关注类别的多样性,多使用单分类器模型,且多基于平衡样本进行研究。本文基于风险管理和分类预测
颗粒前体蛋白(Progranulin,PGRN)定位于人染色体17q21.32。作为一种分泌性糖蛋白分子,其蛋白由593个氨基酸组成,包含一个分泌信号肽和七个半高度保守的半胱氨酸衔接的重复结
在新课程改革的背景下,《义务教育语文课程标准(2011年版)》提出要全面提高学生的语文素养理念,语文是“百科之母”,是学好其它科目的基础学科,也是学生实现全面发展的基础。提高学生的语文素养离不开教师课堂教学,教师的教学行为有效是课堂教学质量的保障。因此,教师的教学行为越来越受到社会各界的关注,教师教学行为的研究也成为了课堂教学改革的焦点之一。同时,这也是促进教师专业化发展的研究趋势。本研究主要目的
零缺陷这一理念是在20世纪60年代由国际质量专家菲利浦·克劳士比先生提出的,作为一种先进的质量管理思想,越来越被全世界的工商业广泛接受与认可,并将其作为一种科学的质量
ODS钢凭借着其优异的抗辐照性能和抗高温性能,成为聚变堆第一壁/包层重要要的候选结构材料。本文以9Cr-ODS钢为研究对象,尝试制备出具有双尺度晶粒尺寸分布的9Cr-ODS钢,采用机械合金化法并通过控制时间制备出不同球磨程度的合金粉末,而后在细晶粉末中加入体积分数为35%的粗晶粉末,并混合均匀。在1000℃,135MPa下进行热等静压烧结(HIP),并针对具有双尺度晶粒尺寸分布的9Cr-ODS钢在
建筑不单纯是一种物质产品,还是一种精神文化产品,它不仅具有居住的功能,还蕴藏了深厚的伦理精神,这些伦理精神可供我们研究出对当下生活指引的方向。中国明清官式建筑集合了中国古代建筑所有的建筑技术、文化和所蕴含的伦理观于一身,是中国古代建筑几千年来发展到最后的辉煌时期。细看封建社会中中国传统建筑在最后沉淀的精华,它是中国传统文化和哲学的物质外壳,也在其中映射出一些伦理规范和对人们的终极关怀。要研究中国明
当前,随着人们对信息时代知识的深入了解,大数据、物联网以及云计算等新兴术发展带来了巨大的研究机遇。而复杂系统下,多维度数据的预测与分类在数据挖掘技术领域下受到研究者们的广泛关注。并且在众多产业技术领域,例如,在共享数据经济、生物学信息分析、能源化工分析、以及电子商务用户行为分析等均得到普遍的应用。一方面,面对各个领域内日益增长的数据信息,其中蕴含着极其丰富的知识和决策类信息。在多维度数据集中进行更
“价值增值”是近些年在内部审计研究领域国内外学者比较热衷讨论的话题,同时也是企业管理者比较关注同时又比较困惑的问题。目前内部审计促进企业实现价值增值的理论方面的研究已经日臻成熟,但实践层面的研究还有待进一步深化。GH公司主要从事特种材料的研发、生产与销售,是集传统制造业以及现代化管理于一体的高新技术企业,是特种材料细分领域内的典型代表性企业。本文选用GH公司作为案例研究对象,从价值增值视角下对其内
VEGF(Vascular Endothelial Growth Factor,VEGF)家族共分为六个亚组,包括血管内皮细胞生长因子A、B、C、D、E及胎盘生长因子。其中,血管内皮细胞生长因子A是调节血管生成以
目的:利用中药饮片和粉末图像中颜色的种类和分布特征,构建与尺度和旋转无关的颜色匹配模板,建立中药饮片和粉末的颜色表征及图像识别方法。方法:(1)抽取不同药用部位的药材样品,包括花、根茎、种子和果实类,各选取相应的两个观察面摄取图像,经图像分割、RGB颜色模型转换为Lab等图像处理过程,提取各观察面的图像前景的颜色参数。两个观察面的颜色向量按降序排序,插值缩放至一定尺度,按1:1的权重构造综合颜色向