【摘 要】
:
我国有庞大的听障人士群体,手语是他们与外界沟通交流的主要渠道。如何从手语手势动作中识别听障人士想表达的内容,是减少听障人士和健全人之间沟通障碍的关键。目前的手语手势识别方法有一些局限。如,只用单一模态的信号采集手语手势,无法获取手势动作中的全部信息;只关注手语手势动作所代表的语义信息,而忽略了听障人士手语动作中反映的情绪状态;由于手语使用对象和语境的变化,导致缺乏跨域的泛化性,在新数据集中模型识别
论文部分内容阅读
我国有庞大的听障人士群体,手语是他们与外界沟通交流的主要渠道。如何从手语手势动作中识别听障人士想表达的内容,是减少听障人士和健全人之间沟通障碍的关键。目前的手语手势识别方法有一些局限。如,只用单一模态的信号采集手语手势,无法获取手势动作中的全部信息;只关注手语手势动作所代表的语义信息,而忽略了听障人士手语动作中反映的情绪状态;由于手语使用对象和语境的变化,导致缺乏跨域的泛化性,在新数据集中模型识别效果下降。针对这些问题,本文提出了基于注意力机制的手语手势识别模型和基于域对抗的情绪识别模型。为了解决手语手势多模态信号融合的问题,我们提出了基于注意力机制的手语手势识别模型。用特征编码器分别编码表面肌电流(Surface Electromyography,s EMG)和惯性传感器(Inertial Measurement Unit,IMU)两种模态信号中的手势信息,并使用自注意力机制分别计算权重,融合两种编码特征。同时,我们还采用了参数迁移学习方法,将在源域完成训练的模型参数迁移至目标域,用少量目标域数据微调即可达到大量数据训练的效果,减少了模型训练成本。为了实现手语情绪跨语义识别,我们提出了基于域对抗的情绪识别模型。该模型由特征提取器、域分类器和情绪分类器组成。特征提取器和域分类器组成对抗训练部分,在对抗训练过程中,特征提取器将逐渐提取既有情绪分类能力,又有域不变性的潜在特征。依靠域不变特征,就可以在只使用源域数据的条件下实现情绪跨语义识别。最后,本文通过带有传感器的可穿戴设备采集手语手势数据,从多个角度验证了本文提出方法的有效性。
其他文献
近年来,社会能源紧缺问题日益突出,智能玻璃作为一种性能优异的光电子器件可以极大地节约建筑能源,减少电力能耗。一个理想的智能玻璃应具有散射可见光以避免使用窗帘和调节近外红(NIR)光的透过率以维持舒适的室内温度的双重功能。然而,目前大多数智能玻璃只能单一地调节室内亮度或温度,效果并不理想。本文基于具有近红外透过率可调特性的二氧化钒(VO2)薄膜和具有可见光透过率可调的聚合物稳定胆甾相液晶(Polym
肺炎是一种多发且严重的感染性疾病,可发生于任何年龄阶段,严重影响患者的生命健康,因此,肺炎的早期发现以及治疗是非常重要的。然而肺炎图像的结构复杂性、灰度分布不均匀等问题严重影响了肺炎分类的准确性。传统的肺炎分类主要依靠有经验的医生,其分类结果易受主观条件的影响,准确率得不到保证。近年来伴随着深度学习的发展,卷积神经网络被广泛地应用于肺炎图像分类。作为经典的卷积神经网络,Dense Net网络由于在
随着3D扫描技术等非接触测量技术的快速发展,点云表示3D形状已被接受为曲面的常见描述,这催生出了相关的数字化建模方法。但至目前,一般的表面配准和曲面拟合等方法虽然可以较方便地实现曲面的参数化建模,但不适用于处理医疗和康复领域中常见的精细化、精准化定制设计任务,如医用压力袜的设计任务。这是因为这些方法往往需要较多的特征点来提高形状表示的平滑度与光顺性,这将不可避免地导致精度和计算效率之间的平衡困境;
数字信号处理(Digital Signal Process,DSP)+可编程阵列逻辑(Field Program Gate Way,FPGA)正在广泛应用于复杂的数字信号处理领域。针对DSP与FPGA单个处理器性能有限、不够灵活等问题,提出DSP+FPGA架构的系统设计方案,基于TMS320C6748(DSP)和EP3C40Q240C8N(FPGA)芯片的外部存储器接口(External Memo
<正>本文通过对我国31部省级“十四五”档案事业发展规划的分析,解读“十四五”时期我国档案事业发展任务与重点,为未来五年我国档案事业的发展提供参考,提出未来主要从服务中心大局与民生、加强数字转型、推进档案文化建设、确保档案安全、助力区域协同发展等方面促进我国档案事业的高质量发展。
人工智能推动多行业智能化发展,如生物医学,计算机视觉,油气工程开发等,而偏微分方程求解始终是其中研究的热点问题。传统的数值求解方法因计算量大,网格生成开销大等原因限制了其发展。本文围绕非稳态偏微分方程求解问题展开研究,主要创新点和研究工作主要有以下三点:(1)针对三维非稳态偏微分方程问题,本文提出了3D-PDE-Net求解方法,结合小波分析中消失矩理论和泰勒展开定理,从理论上证明三维卷积核在表达能
煤层气是一种非常规天然气,其燃烧后不产生废气,是一种清洁能源,但其在开采时难度较大,需要使用先进的工艺进行钻井开发。本文就煤层气多分支水平井钻井工艺进行研究,对钻井过程中的难点和问题进行分析,探究煤层气开发工艺措施,旨在提高煤层气开发效率,不断提升实际的勘测技术水平。
结合工业机器人应用编程职业技能等级证书试点,阐述了在1+X证书制度试点初期存在的一些问题,并以工业机器人技术专业试点"工业机器人应用编程"技能等级证书为例进行试点探讨,指出了目前证书试点过程中所存在的一些教学问题,并针对相应问题提出了试点实施的具体思路。
数字岩心重建技术可以在孔隙尺度上描述岩石的微观结构,已经成为定量分析岩石物理特性和孔隙分布、模拟纳米孔内流体流动的关键。数字岩心是孔隙级微观渗流理论研究的基础平台,能够可视化和定量化岩心样本并有效描述储层岩石孔隙空间情况、研究储层内部的流体运移机制。传统的数字岩心建模数值重构方法如多点地质统计法、模拟退火法等,重构时间长,效率低,对岩心样本的要求高。而生成对抗网络(GAN)作为一种新的数值重建法,
可展曲面可以在没有伸缩和撕裂的状态下展开到一个平面上,在建筑业和产品制造等领域具有广泛的应用,因此可展曲面的构造方法一直是曲面几何设计领域学者们重视的问题。在微分几何中,测地线、渐近线、曲率线是曲面上三类重要的内蕴几何特征线,它们在整体或者局部上影响着曲面的性质,因此由给定的一条具有内蕴几何特征的特征线来逆向设计所需参数曲面束是新兴的研究热点。在欧式空间中,关于插值特征线构造可展曲面的研究有很多,