【摘 要】
:
微表情是一种快速的、难以用肉眼观察到的,可以反映人类真实内心情感的面部表情。由于微表情能体现人们真实的感受和动机,因此常应用在商务谈判、警察诊断、精神分析等领域。然而由于微表情持续时间短(1/25-1/2秒之间)、变化细微(肌肉收缩或舒张幅度较小)的特点,微表情识别仍是一个巨大的挑战。近年来,随着深度学习的发展,深度神经网络算法以及注意力机制的广泛应用,为微表情识别带来了新的研究方向。基于此,本文
论文部分内容阅读
微表情是一种快速的、难以用肉眼观察到的,可以反映人类真实内心情感的面部表情。由于微表情能体现人们真实的感受和动机,因此常应用在商务谈判、警察诊断、精神分析等领域。然而由于微表情持续时间短(1/25-1/2秒之间)、变化细微(肌肉收缩或舒张幅度较小)的特点,微表情识别仍是一个巨大的挑战。近年来,随着深度学习的发展,深度神经网络算法以及注意力机制的广泛应用,为微表情识别带来了新的研究方向。基于此,本文使用深度学习来创建自动的微表情识别算法,以选取更具代表性的微表情特征进行微表情识别,并实现了一个微表情识别系统。本文在以下方面进行了研究:(1)提出了一种基于3D2D混合结构的微表情识别方法,该方法先使用多个三维卷积提取时空特征,再使用二维卷积以及注意力机制提取更高层次的、更关键的空间特征,最后使用Softmax对微表情分类。在数据集上进行了一系列对比实验,显示该模型效果优于其他方法。(2)提出了一种基于注意力机制的三维卷积微表情识别方法,该方法是一种双流结构,可以有效地利用图像序列与光流序列的特征。使用Attention层、Co-Attention层提取更有效的微表情特征以更好地解决微表情识别任务。在数据集上进行充分实验,验证了该模型有较好的识别效果。(3)本文搭建了首个基于注意力机制的微表情自动识别系统——AMMRS(Attention Mechanism for Micro-Expression Recognition System),并将本文提出的微表情识别算法应用到该系统的微表情识别功能模块中,完成整个系统的开发与测试工作。
其他文献
近年来,深度学习技术不断应用于各行各业。本文将深度学习技术应用于金融领域,对商品期货未来价格趋势进行预测。本文分析两类期货数据:数值型数据、文本型数据。数值型数据包括交易数据和指标数据,使用数值型数据可以辅助判断买卖点和趋势。文本型数据包括新闻、机构的分析文章、投资者的评论等多种形式,通过分析其传递出的情感,判断未来价格趋势。因此对这两类数据进行分析对投资者进行决策具有重要意义。数值型数据的趋势预
在现代临床诊断过程中,医生往往需要通过一系列医学成像技术对病灶进行分析,最终确认诊断结果。由此可见医学影像技术在现代医疗中扮演着关键性的角色。传统的图像配准算法,如B-spline和SYN等在医学配准中取得了很好的效果,但是它有一定的局限性,如适应性差,一种方法或一组参数只适用于某一特定模态甚至特定的数据集上;处理速度慢,传统的配准算法大都采用迭代优化的方式,导致其处理速度相当慢,无法进行实时配准
随着科技的发展,智慧家居、驾驶手势以及智慧医疗等人机交互的应用都会将手势交互技术加入其中,而手部姿态关键点估计对于手势交互技术的发展是十分关键的。深度学习不断发展,使手部姿态关键点估计发展迅速。然而目前手部姿态关键点估计存在以下两个问题:一是当前研究基本只对单手关节点进行检测而更实际和复杂的场景中,处理完整的图像,它不仅包含多只手,还包含人体、背景等其他物体;二是数据集短缺。网络的训练需要高质量的
2021年4月,习近平总书记在广西视察时强调,要"在推动边疆民族地区高质量发展上闯出新路子"。自治区第十二次党代会提出,要"在边疆民族地区率先实现高质量发展"。当前,我国已进入高质量发展阶段,边疆民族地区同步进入转型升级谋发展的关键时期。我区具有沿海、沿江、沿边的独特区位优势,推动边疆民族地区高质量发展迎来新的发展机遇,也面临新的挑战,在凝心聚力建设新时代中国特色社会主义壮美广西新征程上,
大脑年龄是衡量大脑衰老程度的一种生物标志物。大脑的异常发育和衰老会造成大脑年龄和个体真实年龄的偏差,这种偏差可以客观地反映大脑衰老的程度。大脑结构磁共振影像是一个高分辨率的三维影像。利用影像学技术从磁共振影像中预测大脑年龄,有助于发现以脑损伤、精神分裂症、阿尔茨海默症为代表的脑疾病。因此以大脑磁共振影像为数据的大脑年龄研究具有极大的医学诊治价值。传统的脑龄预测方法从大脑的磁共振影像中提取手工特征,
智能化、信息化的快速发展便利了人们的生活,人工智能技术已渗入到生活的方方面面。然而凡事都有利弊,人工智能也不例外。在我们享受着人工智能带来的便利与幸福感的同时,安全领域的挑战和威胁也随之而来。例如:自动驾驶汽车频繁发生事故致人死亡。深度学习是人工智能领域常用的一种技术,在训练神经网络模型时,由于训练过程复杂且计算量大,训练过程常外包到服务商,然而在训练外包过程很容易受到后门攻击。攻击者在训练过程中
目前,心血管疾病由于其过高的致死率而被越来越多的人关注,而导致心血管疾病发病的主要诱因是冠状动脉内存在粥样硬化斑块,因此对冠状动脉斑块的精准诊断是亟待解决的重大临床问题。近年来提出的冠状动脉CT血管造影成像技术(Coronary CT Angiography,CCTA)因为其具备比较高的分辨率以及非侵入式、三维成像等特点,已经逐渐演变成为冠状动脉疾病早期初筛的标准方法。传统上,主要通过放射科医生对
秦腔是我国的传统民间戏曲,流传至今已有几千年历史。目前,由于民间艺术的表现形式过于单一,青年一代不再热衷传统文化,导致秦腔面临着无人传唱乃至消失的危险。为了让秦腔戏曲得以流传,可以将现代科技元素融入到秦腔戏曲表演中,如将VR展示或沉浸式体验等虚拟现实技术与传统的秦腔戏曲表演相融合,实现多元化的表演形式,赋予秦腔新的生命,使传统文化得到保护和传承。秦腔戏曲情感特征复杂,使得计算机对其自动理解非常困难
全球一体化的今天,拥有不同语言背景的人们跨语言交流的机会越来越多,语种识别技术作为多语言智能语音处理系统中核心的前端处理模块,是智能语音处理领域的研究热点之一。在实际应用中往往需要对语音进行实时的处理与判断,因此短语音的语种识别需求日益增强。在极短的时间内通过有限的信息做出准确识别是一个难点,也是近几年语种识别领域的一个研究热点。近年来智能语音设备逐渐渗透入人们的日常工作生活中,而人们在日常中使用
振动信号检测在结构健康监测、地震波检测、油气管道监测等领域都有着重要应用,大型土木工程在使用过程中不可避免地会因环境负荷,疲劳影响等因素使结构体出现不同程度和类型的损坏,这些设施的大多数异常和损坏故障都会引起结构体振动,对振动信号的检测可以保证结构体的稳定。在地震勘探领域中通过人工制造震源并通过传感器获取振动信息,可以分析地壳的结构和介质变化,这对油气勘探、地下水探测和土木建设都有着重大的意义。在