【摘 要】
:
近年来,由于数据采集技术的快速发展,多视图数据在实际生活中越来越常见。多视图学习就是将多个视图的信息结合起来进行学习的方式,以获得更好的结果。然而噪声、数据采集的故障等许多无法预料的因素导致数据缺失,数据会在单个视图或多个视图中随机缺失,不完整多视图聚类就是对此类有缺失的多视图数据按照一定规则划分成几个簇的过程。以往的常规方法无法直接处理此类数据,因为它们都是在所有视图都没有缺失的的前提下进行学习
论文部分内容阅读
近年来,由于数据采集技术的快速发展,多视图数据在实际生活中越来越常见。多视图学习就是将多个视图的信息结合起来进行学习的方式,以获得更好的结果。然而噪声、数据采集的故障等许多无法预料的因素导致数据缺失,数据会在单个视图或多个视图中随机缺失,不完整多视图聚类就是对此类有缺失的多视图数据按照一定规则划分成几个簇的过程。以往的常规方法无法直接处理此类数据,因为它们都是在所有视图都没有缺失的的前提下进行学习的。不完整多视图数据聚类就是研究如何在数据缺失的情况下,综合考虑多个视图,尽可能利用有效信息去除无效信息,提高聚类准确度。虽然近年来研究人员提出了一些不完整多视图聚类方法,但依然存在着一些不足,比如有的方法不能处理超过两个视图的多视图数据,然而在实际生活中很多多视图数据都不止两个视图。有的方法时间复杂度较高,很难处理大规模数据集。有的方法参数太多,难以调参。有的方法对数据的缺失情况要求较高,要求至少有一个完整的视图或者要求多个视图之间必须有对齐部分(有样本包含所有视图特征)。因此,本文做出了相关研究,提出了两种方法来解决以前方法的上述不足。1.本文提出了基于锚点的自适应不完整多视图聚类算法。该算法首先选择多个视图的公共部分作为锚点来构建锚点图,然后使用自适应邻居分配策略来构建样本和锚点之间的相似度,最后,在一致性矩阵上执行谱聚类得到聚类结果。我们的方法不仅避免了繁琐的参数调节,还具有很好的扩展能力,可以扩展到两个以上的视图,更易于实际应用。2.当多个视图之间没有公共对齐部分,也就是当没有样本包含所有视图特征时,以前的很多方法都没法进行聚类。因此我们提出了一种更通用的不完整多视图聚类方法。该算法先求解每个视图中未缺失样本间的相似度,在此基础上,对每个视图的权重分布进行调节,使关键视图的权重增大,最后加权融合生成一致相似度矩阵。该算法充分发挥了多视图数据的优势,不同视图的信息彼此加强,提高了聚类性能。此外,该算法时间复杂度低,适合大规模数据集。在多个数据集上的实验验证了我们方法的可行性,与现有的方法相比,我们的方法简单,易于实现,在运行时间更少的同时提高了聚类准确性,具有较高的理论和实践意义。
其他文献
多肽是一种天然存在的物质,大小从2到50个氨基酸不等。自20世纪胰岛素疗法出现以来,肽疗法在医学实践中发挥了显著的作用。与传统的药物相比,他们具有几个优点:易于合成、毒性低、较高的靶向特异性和选择性。癌症和病毒感染一直是导致死亡的主要原因,对人类健康有很大的影响,也是发达国家和发展中国家关心的健康问题。传统的癌症治疗方法依赖于放疗和化疗,这也给患者带来了严重的副作用。作为一种治疗肽,抗癌肽(ACP
遥感图像工厂提取作为计算机视觉领域中新兴的热点研究课题,不仅在学术上推动了建筑物提取和道路检测等遥感领域的理论研究,而且在工程应用上为城市规划管理、土地利用和地图更新等系统提供了技术支持。随着深度学习的快速发展,遥感图像的目标提取任务取得了突破性的进展,但其算法在工厂这一类别上由于特定的诸多挑战依旧难以发挥优越的性能,例如工厂外观上存在颜色、纹理、尺度的巨大差异性以及遮挡、阴影等挑战。另外,高分辨
显著目标检测通过模拟人类视觉感知系统来定位场景中最具吸引力的目标,在实际应用中发挥着关键作用。虽然显著目标检测已经受到学者们的广泛研究并取得了极大的进展,但仍然存在着很多问题,比如场景复杂、光照条件不足、前景和背景相似等。深度(Depth)图像可以为RGB图像提供更多的空间结构信息,由此RGB-D显著目标检测应运而生。但RGB-D显著目标检测仍面临着如何有效利用两种模态信息的巨大挑战。为了解决这个
STEM教育和初中科学实验教学都注重培养学生的实际动手能力,而STEM教育主张将科学、技术、工程、数学四个学科进行综合教学,以有效促进学生在不同领域的全面发展。教师可分析STEM教育理念在初中科学实验教学中的应用价值与现状,有针对性地实施教学。实践时,教师可先设计实验情境,唤醒学生的知识网络,再以讨论带动创新,引导学生设计实验方案,然后让学生探究实验步骤,并切实动手实践,最后整合学习资源,让学生复
三支决策是一种处理复杂问题的有效方法,符合人类处理信息的认知方式。其主要包含“分”、“治”、“效”三个步骤。“分”是将整体划分为不相交的区域,“治”是制定策略使对象在不同区域之间移动,“效”是优化三分法和策略以达到预期的结果,其中,分是基础,治是手段,效是最终的目的。“治”是三支决策中一个关键的环节,通常是制定移动策略使对象从不利区域中移动到有利区域中。现有移动策略主要有两种:一是将不利区域中的对
胸部X光影像被广泛应用于胸部疾病的诊断与治疗。根据病人的胸部X光影像,医生需要通过影像中的表现给出细致的描述与诊断意见,最终形成一份诊断报告。随着影像技术的发展,影像科医生每天需要审阅大量的影像数据并为每一份影像撰写诊断报告,这占据了影像科医生的绝大部分工作时间。因此开展能够自动生成诊断报告方法的相关研究显得尤为迫切。大多数现有的医学影像报告自动生成的方法是先根据病人影像检测出疾病异常,然后根据检
目的探讨髋臼有限加深、全髋置换术结合软组织松解、骨创治疗仪治疗成人股骨颈骨折及严重股骨头缺血性坏死伴髋关节骨性关节炎的近期疗效。方法对38例41髋成人股骨颈骨折、股骨头坏死、髋关节骨性关节炎患者实施了髋臼有限加深法非骨水泥假体全髋置换术并结合软组织松解、骨创治疗仪治疗。结果经术后6个月至5年6个月的随访,所有病人患髋疼痛消失,可以长时间行走,X线片示人工髋关节位置良好,假体无松动及明显下沉迹象,生
社会转型期,我国教育改革正不断向纵深方向发展。家校共育领域中,无论从政策落实到实践路径的优化,都非常期待家长能够以全新的姿态扮演好新时期教育利益相关者的角色。本文围绕家校共育中家长有什么样的责任?实践样态如何?如何保障与改进家校共育中家长责任的实现三个方面的问题展开探究。
骨架是三维模型的一种紧凑的一维表示,可以将三维模型转换为更简单的表示形式。目前的骨架提取方法因为点云提供信息的稀少以及复杂的柔性变化,仍然不够稳定。因此本文研究探讨了非刚性点云间的基于稀疏匹配对的一致性骨架提取技术。首先在现有的单个点云曲线骨架提取技术的基础上提出了一种改进的方法,能够更好的提取出骨架。其次提出一种在多个形状中进行骨架协同提取的方法,使得多个点云具有一致的骨架结构。具体来说,本文主