【摘 要】
:
随着科技的发展,人们获取和存储照片、视频的成本变得越来越低,而照片与视频中的人脸信息往往是人们关注的重点之一。因此,探索一种有效且高效地处理海量人脸信息的算法模型具有十分重要的研究价值和意义。人脸聚类是一种挖掘未标记人脸数据的方法。然而,由于人脸数据的规模非常庞大且特征分布十分复杂,导致一些传统聚类分析算法在处理这些真实人脸数据时表现较差。最近的研究通过使用图卷积网络(GCNs,Graph Con
论文部分内容阅读
随着科技的发展,人们获取和存储照片、视频的成本变得越来越低,而照片与视频中的人脸信息往往是人们关注的重点之一。因此,探索一种有效且高效地处理海量人脸信息的算法模型具有十分重要的研究价值和意义。人脸聚类是一种挖掘未标记人脸数据的方法。然而,由于人脸数据的规模非常庞大且特征分布十分复杂,导致一些传统聚类分析算法在处理这些真实人脸数据时表现较差。最近的研究通过使用图卷积网络(GCNs,Graph Convolutional Networks)从人脸图像之间的邻域信息中学习聚类结构。这些方法虽然提高了人脸聚类的精度,但是也存在一些问题:首先,这些方法构建了大量的重叠子图来描述节点周围的局部结构,使其效率不高;其次,手工设计的子图限制了聚类效果;最后,这些方法过度聚类导致所产生的类别数过多。针对上述问题,本文对基于图卷积网络的人脸聚类算法进行了研究与改进,主要包括以下两个方面:(1)针对目前人脸聚类算法效率不高的问题,本文给出了一种自顶向下的聚类框架——基于置信度的简单图卷积网络的人脸聚类模型。该模型获得了更精确的聚类结果,同时也提高了聚类的效率。具体来说,该模型不通过构造任何子图,而是将整个图作为一个整体进行图卷积操作,并且去除了图卷积模块中的非线性结构,降低了模型的计算复杂度。随后,本文设计了一种有效的置信度计算方式,以更好地表示嵌入的特征。此外,虽然现有的大多数基于GCNs的方法是有监督的,但本文还设计了一种无监督的置信度计算方式,使得模型可以拓展为不依赖真实标签信息的版本。在MS-Celeb-1M、You Tube-Faces和Deep-Fashion三个数据集上进行的大量实验表明,该模型无论是在有监督还是无监督的情况下,都提高了聚类精度,并且减少了执行时间。(2)由于直接通过阈值很难判断两张人脸图像是否属于同一类,因此我们在上一个模型的基础上,通过图卷积网络学习得到节点之间的连接关系,给出了一种自底向上的聚类框架——基于特征加权图卷积网络的人脸聚类模型。该模型利用节点置信度为节点构建更加清晰的局部子图,特征加权图卷积模块利用特征加权函数,使得图卷积网络可以保留更多重要的信息。通过链接预测分类器判断两个节点之间连接的概率,最后通过聚类标签传播算法得到聚类结果。将模型在三个公开数据集中进行了大量的实验,并对实验结果进行了详细地分析,最终验证了该模型的有效性。
其他文献
深度学习技术已经被广泛应用于图像处理和语音识别等领域,主要原因是该技术通过使用深层次的非线性结构能够学习相关数据特征,由此能得到数据深层次特征之间的联系。目前,国内外相关学者和研究人员已经将深度学习技术应用于文本处理等相关问题中,解决了传统机器学习算法存在的无法处理大量复杂数据的问题。但是,现有的字符级文本分类方法在提取关键信息能力方面还存在不足,例如下采样丢失关键信息以及数据稀疏等问题,导致实际
随着计算机技术的快速迭代,人们的日常生活也发生了革命性的变化,计算机视觉技术带给人们巨大的便利。立体匹配是一个基本的三维视觉问题,只需要两台相机即可完成对场景深度的估计,因此可直接应用于机器人、增强现实、摄影测量和视频理解等领域中。同时,热成像设备逐渐地小型化、廉价化、清晰化,相比于常见的可见光成像设备容易受到时间、环境等问题的干扰,热成像设备对光线不敏感的特性愈发受到学者们的青睐。红外热像立体匹
网络表示学习,也称为网络嵌入,旨在将网络中的节点使用低维稠密的向量进行表示,使得表示后的节点向量尽量保持网络中固有的结构相似性和属性相似性。嵌入后的节点向量可以被应用于节点分类、节点可视化等众多网络分析任务中,从而帮助人们快速方便地提取网络中潜在的重要信息,因此网络表示学习具有很重要的研究意义。目前大多数网络表示学习方法是针对固定不变的网络进行嵌入的,而对于一个不断增加新节点的网络则没有归纳表示的
优化问题是指在所有解空间中求取最佳解的问题,如旅行商问题、背包问题和资本预算问题等,较有代表性的经典优化算法,如梯度下降法、共轭梯度法、拉格朗日乘数法等,但是这些经典算法在解决复杂的高维问题和求解全局最优化问题等方面,存在诸多不足,难以得到较好的效果。近年来,群智能优化算法因其适用范围广、操控简单等优点受到了科研工作者的青睐。群智能优化算法启发于自然界中蚂蚁、蝙蝠、鱼群等生物群体行为机制,单个生物
目的 总结慢性阻塞性肺疾病(COPD)患者雾化吸入装置规范应用的最佳证据,为患者能够正确、有效使用吸入装置提供指导,为长期开展雾化吸入实践提供循证依据。方法 计算机检索国际指南图书馆(GIN)官网、新西兰指南工作组、欧洲呼吸协会、加拿大安大略注册护士协会(RNAO)官网、英国胸科协会(BTS)、中国指南网、英国国家临床医学研究所指南库(NICE)、JBI、Cochrane Library、BMJ、
DNA结合蛋白(DBPs)和RNA结合蛋白(RBPs)在基因调控和基因表达中起着至关重要的作用,包括转录和选择性剪接。此外,大量研究表明一些蛋白与人类的疾病相关。因此,准确识别出与DNA/RNA结合的蛋白具有重要意义。由于DBPs和RBPs在生物上具有相似的功能结构,传统方法需要人工提取特征以及需要耗费很大的成本和时间,无法满足目前大规模基因组数据进行测试的需求。因此,如何有效地识别出核酸绑定蛋白
当前推荐算法中数据种类丰富且表示复杂,传统的推荐算法中使用的数据分析模型和方法,对精度提升效果不理想。缺乏统一的框架对复杂数据进行建模,即便是对同一类数据,数据中蕴含的信息也无法进行分类建模。因此针对以上问题,本文提出对信息进行分类,刻画数据中蕴含的各种信息,将数据中的有效信息挖掘出来,对信息进行相应的归类和建模。本文将用户和项目的交互数据蕴含的信息按照是否可以线性获取分为显式反馈信息和隐式反馈信
融资市场集资预测一直是金融领域的一个热点研究课题,如融资市场中众筹活动的集资表现预测和众筹活动集资周期的预测。融资市场类别多种多样,如教育融资和创业融资等,很多科研人员针对特定融资市场做了相关集资预测研究。在教育类融资市场中,传统的算法更多的是利用历史数据和经验方法,这些传统的实证分析方法不能有效利用到现实生活中的社交关系和融资信息,很难精确地挖掘融资市场中众筹活动的融资能力。所以本文提出基于深度
人手的姿势复杂多变,极小的手势形变就包含了丰富的信息,并且同一个人做出同一种手势,动作也不尽相同,这些都加大了手势检测的难度。手势识别是人机交互的关键技术,并且在很多的领域都有重要的应用。近年来基于深度学习的手势检测与识别技术发展迅猛,但是由于手势检测与识别容易受到光线变化和手势阴影等影响,因此面临着巨大的挑战。本文针对手势检测和识别任务的问题和挑战展开了如下研究:(1)为了解决传统方法难以应对手
在车载网络系统中,信息传播离不开车辆与基础设施之间的交互。然而,交互过程常常受到恶意第三方的破坏,严重时可能威胁到驾驶者的生命安全,因此保护车辆相关信息以实现安全、高效的交互非常重要。信任机构通常在车载网络中扮演关键角色,需要与多个车辆进行交互。当信任机构向多辆车发送相同的消息时,需要与每辆车协商并发送不同的密文,存在冗余加密问题。尤其是在传输大量消息时,冗余加密问题会更加严重。同时,由于冗余操作