基于多线索融合的人脸表情识别方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:cuichenyyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情可以有效地表达人的情感,是一种可以最直观传递人情感状态的非语言信号。在计算机与人工智能快速发展的背景下,基于深度学习的人脸表情识别技术在计算机视觉领域中发展迅速,并在智慧康养、人机交互等领域取得了众多应用成果,逐渐成为学术界和工业界研究的热点。然而,以往基于传统深层网络的表情识别研究主要利用单一面部表情线索信息,当面部表情被遮挡、图像质量不高时,传统方法的性能往往较差。考虑在真实场景中,人所处的情境中也包含多种可用于情感判别的线索信息,由此可见,传统方法未充分利用情境中的线索。此外,在很长一段时间里,对人脸表情识别的研究所使用的数据集均为受控环境中采集的,虽然取得了很高的识别率,但在非受控环境下,其识别效果大大降低;与此同时,特征提取是表情识别过程中最为重要的一部分,网络模型的特征提取能力通常在很大程度上决定其性能的好坏。因此,设计一个可以提取更加全面而丰富的特征信息的网络模型是提高表情识别准确度的关键。针对上述问题,本文设计了一种具有双分支结构的深度学习模型,并将其命名为基于多线索融合的网络模型(Multi-cues Fusion Net,MCF-Net)。该模型主要由双流编码网络和自适应融合网络两部分组成。具体来说:1)针对人脸编码流分支,本文提出稀疏掩膜注意力学习(Sparse Mask Attention Learning,SMAL)模块,该模块可以根据输入图像自适应地生成相应稀疏性面部掩膜,能更加便捷、准确的提取丰富的关键性面部表情信息,在只有少量参数增加的情况下,提高了整体模型性能;同时,提出多尺度注意力(Multi-scale Attention,MSA)模块,该模块可以确保提取的细粒度特征子集在上下文中包含更加丰富的多尺度通道-空间交互信息。2)针对情境编码流分支,提出关系注意(Relational Attention,RA)模块,该模块可以通过捕捉人脸与情境中某些区域特征之间的相似性来构建二者之间的隐藏关系,从而提取到除脸部信息外的更加全面而丰富的情境信息,进一步提升整体模型性能。为了验证所提出的MCF-Net模型的有效性,本文在两个公开的大规模静态人脸表情图像数据集CAER-S和NCAERS上进行了相关实验,实验结果表明本文提出的MCF-Net模型能够取得较好的表情识别效果,性能总体优于基准(baseline)方法和当前一些其它主流的人脸表情识别方法。
其他文献
随着科技的不断发展,以物联网、云计算等技术为支撑的大规模开放在线课程正逐渐成为一种大众喜爱的学习方式。在线课程摆脱了传统课堂的时空约束,对学习者的资质限制较少,具有自由、灵活的优势,但是其也面临着管理难以规范化、辍学率高、通过率低等问题。为了提高课程的完成度,研究人员通常基于平台中学习者的历史学习行为数据,采用机器学习模型预测学习者发生辍学的可能性。机器学习模型强大的建模能力,能够实现对学习者学习
学位
人类拥有精确跟随他人视线的能力,这种追随他人视线的能力被称为凝视识别,这种能力可以让人们更好地理解他人的意图,甚至可以预测他们未来的行动。计算机一旦掌握这种能力,就能在多个领域(教育、医疗、智能监控、VR游戏或人机交互领域)为人类提供更方便、更智能的服务。近年来,随着深度学习的不断发展,凝视识别这一基础研究取得了一系列的突破,这无疑推动了计算机视觉的进步。虽然目前大多数凝视识别算法取得了令人印象深
学位
目标检测任务是计算机领域中的一个重要研究分支,涉及的应用领域也十分广泛,例如,医疗影像、智能交通安全等。以智能交通安全领域为例,通过在街道各个角落安装高清摄像头,实时获取街道行驶车辆的交通轨迹,以便及时提醒驾驶人遵守交通规则,避免车祸的发生。目标检测技术已成为生活实际场景中的重要工具。目前,基于深度学习的YOLO目标检测算法系列中,YOLOv4算法在单个GPU上就可完成训练,而且使目标检测的速度和
学位
随着科学技术和共享经济的不断发展,短期租赁服务网站越来越多。Airbnb作为著名的短期租房平台,已经成为了很多年轻人出门旅游住宿的首选。对于租房销量来说,价格因素不可忽视,但是不同于传统酒店业成熟的定价体系,Airbnb平台上租房的定价是由房东自主决定。房东需要为租房制定合适的价格来吸引更多的房客,而房客也需要了解租房合理的价格以防上当受骗,所以租房价格是一个值得研究的问题。早期对于租房价格的研究
学位
随着消费电子产品日新月异的发展以及社会对公共安全的迫切需求,摄像头网络已经从提供静态监视的早期角色,演变为当前的能够获取大量视频信息以进行智能处理的复杂网络系统,而且功能也不再是简单的监控用途,可以为后续的研究提供资源基础,例如目标识别、目标跟踪、姿态估计等。由于摄像头网络的规模逐渐庞大,需要覆盖的区域也更加复杂,如何降低摄像头网络的组网成本及如何提升目标空间的覆盖率已成为迫切需要解决的问题。因为
学位
跨膜蛋白是存在于生物膜上的一类特殊蛋白质,承担生物膜两侧物质和信息的传导功能,在多种重要的生命过程中发挥至关重要的作用,如物质运输、离子通道、能量传递、信号识别等。由于它们的特异性结构,目前药物市场上约一半以上药物靶点是跨膜蛋白,其结构和功能研究对药物研发具有巨大价值。然而相对于水溶蛋白,生物技术手段难以大规模测定跨膜蛋白结构,虽然近年来样本数量持续增长,但仍然远不能满足相关研究的需要。因此,采用
学位
在所有生命活动中,金属离子借助“结合作用”通过跨膜蛋白形成的离子通道,从而调节多种生物分子的表达和激活,参与细胞信号转导,完成各种基本生物功能。由于跨膜蛋白具备其自身独特的结构和功能特性,正确识别金属离子与跨膜蛋白结合位点,对于蛋白质工程、离子运输机制以及药物设计的阐明都具有重要意义。然而,当前缺乏大规模测定跨膜蛋白离子结合作用的生物实验技术,亟待有效的计算工具为相关研究及应用提供支撑。已有的金属
学位
近年来,随着互联网技术的发展,层出不穷的在线考试平台逐渐进入智能教育领域中。与传统的教育考试方式相比,在线考试平台有着时间上更灵活、空间上更自由的特点,不仅提高了学生的学习效率,同时也减轻了教师在教学过程中批改大量试卷的负担。然而,由于教育智能在线考试系统是从庞大的题库中随机抽取题目进行组卷,这种情况使得学生在平时练习测试的过程中存在灵活性低下、无法针对每个学生的实际掌握情况进行出题等问题和挑战。
学位
大气压冷等离子体作为一种适用于生物治疗的技术,在医学上有着丰富而广泛的应用,包括医疗器械灭菌、口腔、肿瘤及皮肤疾病等领域。大气压冷等离子体的应用有直接和间接两种形式,二者相辅相成。大气压冷等离子体是一种很有前途的皮肤病治疗技术,但仍需要进一步的探索和研究。我们总结了大气压冷等离子体在皮肤科中的直接和间接应用并展望,为等离子体医学的发展方向提供参考。
期刊
问答(Question Answering,QA)是自然语言理解中具有挑战性的任务,近年来备受研究人员关注。目前大多数关于问答的研究都是根据单个文档甚至单个段落来回答问题,即问题的答案往往来源于单个文档或者单个句子,也称之为单跳推理问答。多跳推理问答相对单跳推理问答来说是一个更具有挑战性的任务,它要求模型能够对多个文档和问题之间的关系有深入的理解,即需要模型从文本的不同部分收集信息来回答问题。这就
学位