【摘 要】
:
人脸美感预测(Facial Beauty Prediction,FBP)在计算机视觉领域中是一个非常有趣且富有挑战性的任务,其模拟人类对于容貌图像的感知,捕捉图像中人脸的眼睛、鼻子、皮肤等各项特征,进而量化容貌图像的美感。虽然容颜不代表一切,但拥有一张美丽的脸庞是大多数人内心之中的渴求。容颜的重要性不仅仅体现在个人层面上,在企业层面上,它也能够产生商业价值。因此,研究人脸美感预测具有十分重要的意义
论文部分内容阅读
人脸美感预测(Facial Beauty Prediction,FBP)在计算机视觉领域中是一个非常有趣且富有挑战性的任务,其模拟人类对于容貌图像的感知,捕捉图像中人脸的眼睛、鼻子、皮肤等各项特征,进而量化容貌图像的美感。虽然容颜不代表一切,但拥有一张美丽的脸庞是大多数人内心之中的渴求。容颜的重要性不仅仅体现在个人层面上,在企业层面上,它也能够产生商业价值。因此,研究人脸美感预测具有十分重要的意义。传统的人脸美感预测方法十分依赖于手工制造的特征或人为设计的规则,然而这些特征或规则缺乏深度和精准性。相比之下,基于深度学习的方法能够自动提取和挖掘图片中一些人类难以描述、难以量化的高级语义特征,更适合应用于人脸图像的美感分析。因此,深度学习方法逐步成为人脸美感预测的主流策略。大多数深度学习方法基于一些经典卷积神经网络来改进,但在人脸美感预测这一特定场景中,经典网络并不一定是最优的选择。鉴于重新设计一个高效网络充满挑战,本文基于神经网络架构搜索提出了NAS4FBP框架,该框架采用了多任务学习方案,不仅关注人脸美感的分数和层级,还关注性别和种族来筛选出一个高效的FBP网络。在多任务学习方案中,本文提出一种新的分类损失函数(HBLoss),用来更好地揭示美感层级关系的本质。不仅如此,本文还提出一种简单有效的数据增广方法(Align-Crop),用以丰富训练数据的多样性。在搜索网络架构之后,本文进一步提出了一种非局部卷积注意力模块(NCAM),该模块能够同时关注局部与全局特征信息,进一步提升模型拟合能力。本文使用SCUT-FBP5500基准数据集来展开网络架构的搜索,最终得到一个适用于人脸美感预测的高效网络架构——NAS4FBP Net。文中大量实验表明,NAS4FBP Net具有非常优秀的性能,经过优化后的相关性系数指标可达0.9387,超越其他所有相关研究中的模型表现。
其他文献
全无机钙钛矿纳米晶体CsPbX3(X=Cl,Br,I)由于其优异的稳定性、宽光谱范围的可见光致发光而在太阳能电池领域中备受关注。超快光谱技术提供了能够有效分析影响其光电转化性能的微观物理机制的有效手段。本文主要利用飞秒瞬态吸收光谱测量光激发后的基于金属离子掺杂全无机钙钛矿在光诱导下其光生载流子生成,分离,迁移,复合等超快动力学行为。杂质掺杂和外界压力的改变是调控钙钛矿材料的晶体结构和光学性质及提高
光与原子相互干涉产生的量子相干效应是光学领域的重要研究方向,其中电磁感应光透明(Electromagnetically induced transparency,简称EIT)和电磁感应光栅(Electromagnetically induced grating,简称EIG)是量子相干效应中典型的物理现象。这些现象得到了许多物理学者的关注,极具研究价值与发展潜力。在EIT效应的影响下介质对探测场的吸
近年来,边缘计算的蓬勃发展给机器学习带来了新的挑战和机遇。传统的云端机器学习需要收集用户数据以完成模型训练,但这有泄露数据隐私的风险。而在边缘计算的场景下部署分布式机器学习,即分布式边缘学习,不需要收集用户数据便能完成模型训练。因此,该方案有望成为既能保护用户数据隐私,又能利用数据价值的下一代机器学习解决方案。然而,开发和测试分布式边缘学习面临着众多新的挑战。一方面,当前缺乏对分布式边缘学习通用功
激光诱导击穿光谱(Laser-induced breakdown spectroscopy,LIBS)是用来对样品进行元素鉴别的一种原子发射光谱技术。它的基本原理是:激光脉冲聚焦到样品表面,烧蚀材料产生高温等离子体,通过收集和分析发射的特征谱线就可以确定样品的元素组成。激光诱导击穿光谱技术具有自己独特的优势,例如:对任何状态的物体都可以检测、对样品损伤较小、还可以实现远程在线测量等。因此LIBS技
激光诱导击穿光谱(Laser-induced breakdown spectroscopy,LIBS)是一种以激光和物质相互作用为基础的元素检测和分析技术。LIBS基本原理为脉冲激光经聚焦透镜会聚于样品表面,使得样品表面迅速升温并蒸发出微克量的样品,这些微克量级的样品在瞬间的融化和气化过程中产生高温高压的等离子体,这些等离子体迅速膨胀,辐射出光学信号。最后用光纤收集这些光学信号,并加以分析便可以获
联邦学习是一种能够让多个客户端在不共享数据的情况下协同训练机器学习模型的分布式机器学习技术。然而,已有的研究表明,当客户端之间的数据分布是异构的时候,联邦学习会出现明显的性能下降。为了解决这一具有挑战性的问题,研究人员提出了个性化联邦元学习,其中每个客户端通过在联合训练的全局元模型上进行微调获得个性化模型。尽管个性化联邦元学习在这一问题上取得了不错的成果,但是由于这类方法隐式地假设了不同客户端中采
界面设计是对界面元素布局和人机交互逻辑的整体设计,是APP研发过程中的一个重要环节。传统的APP界面设计主要依赖界面设计师根据软件需求及自身经验来完成,而非专业设计人员往往难以进行APP界面设计。因此,自动识别界面需求文本中的组件信息并自动生成APP界面布局有重要的研究意义。本文设计了一种基于界面需求文本的APP界面布局自动生成方法,具体研究工作包括:(1)针对从界面需求文本中识别组件的问题,本文
分子体系精确的电子结构与光谱是反映分子内部物质结构信息的主要途径,从中可以获得分子的能级结构、分子物理和化学性质等信息。实验获得分子体系的结构与光谱信息受技术手段发展的限制,采用基于量子力学从头计算的分子轨道理论便成为认识分子电子结构与光谱的重要手段。本文采用高精度的多参考组态相互作用方法,主要研究了之前文献中有“争议”的GeH+分子离子、HF分子等体系的电子激发态相关问题,获得了一些分子较为精确
现实中存在大量约束多目标优化问题,这些问题不仅存在多个需优化的目标,也存在诸多限制条件。基于群体搜索的进化算法非常适合求解具有多解特性的多目标优化问题。约束多目标进化算法需要在满足所有约束条件的情况下,得到收敛性和分布性尽可能好的可行非劣解集。在多目标进化算法中处理约束的难点之一是如何有效利用有价值不可行解蕴含的信息,引导种群跨越不可行区域搜索到全局可行前沿;二是如何较完整地捕捉约束带来的形状复杂
高次谐波为产生超快相干XUV光源提供了独特的方法,因具有体积小、高稳定性以及可调谐性等特点,成为了当今获得桌面化极紫外光源的主要手段。对高次谐波发射的谱学及时空特性研究和基于高次谐波光源的电子动力学研究可以让人们更深入的了解微观量子世界。高次谐波本身具有良好的相干性与及极短的脉冲时间特性,对分立级次谐波的能量进行调谐可以拓展谐波源的应用范围与实用价值。在拥有能量覆盖范围较广的XUV光源下,通过阿秒