【摘 要】
:
随着各种形式的计算设备渗入人们生活,手势识别作为最自然的人机交互模式,应用在了不少拥有专业传感设备的场景下。然而近几年随着视频应用的发展,人们希望动态手势识别也能应用于普通的设备之上。但基于由普通设备采集到的RGB视频流的手势识别,通常面临着视频流未剪辑、背景杂乱、手部信息丢失等问题。并且对于实际场景下的动态手势识别,不仅有着实时性及计算资源的限制,还面临着一段手势应该仅被识别一次的单次激活问题。
论文部分内容阅读
随着各种形式的计算设备渗入人们生活,手势识别作为最自然的人机交互模式,应用在了不少拥有专业传感设备的场景下。然而近几年随着视频应用的发展,人们希望动态手势识别也能应用于普通的设备之上。但基于由普通设备采集到的RGB视频流的手势识别,通常面临着视频流未剪辑、背景杂乱、手部信息丢失等问题。并且对于实际场景下的动态手势识别,不仅有着实时性及计算资源的限制,还面临着一段手势应该仅被识别一次的单次激活问题。因此,如何兼顾实际场景下动态手势识别的准确性及实时性,成为了将手势识别应用于实际场景的主要挑战。为了提升RGB模态下三维卷积网络对于动态手势的识别效果,本文提出了一种基于类光流特征提取网络(TVNet)的端到端多模态协作训练架构(TVNet-based Multimodal Training,TVMT)。通过将传统的TV-L1算法迭代过程展开为TVNet网络层,来提取相邻RGB图像帧之间的类光流特征,作为多模态协作训练中的辅助模态。通过时空语义对齐损失函数(SSA)来鼓励不同的模态网络对相同的输入场景学习相同的理解,同时通过焦点正则化参数(FRP)来防止知识的负向迁移。TVMT训练架构使得RGB模态网络能够利用类光流模态网络学到的手势时空特征,来提升识别的准确率。此外,为了解决实际情景下动态手势识别的鲁棒性及效率问题,本文提出了一种基于动态阈值的滑动窗口双网络在线识别架构(Sliding Window based Online Recognition System with Dynamic Threshold,DtSWORS)。使用滑动窗口来处理未剪辑的视频流,并通过唤醒机制,使得离线工作的3DCNN网络也能在线运行。通过后验处理模块来对检测结果进行缓存并过滤,从而进行差错处理。对于手势的单次激活挑战,本文提出使用强化学习网络来对单次激活模块的决策阈值进行学习,从而能针对不同的输入视频特征进行动态的调整。
其他文献
为解析电动汽车混入条件下多方式路网交通状态的判别及动态演化过程,提出一种基于行为分析的多方式动态交通分配模型.基于离散选择理论,构建了不同人群出行选择行为模型;基于点排队模型,动态考虑路网容量、电池剩余电量和充电站服务水平等因素,提出了多方式动态交通分配模型及求解算法;并进行了算例验证.结果表明:电动汽车初始荷电状态(SOC)、充电服务费及充电桩数量等因素均对交通系统产生显著影响.本文提出的公共充电设施容量配置方案可降低用户成本3.61%,降低充电桩购置成本15.86%,减少交通系统CO2排放0.76%,
从柴油机诞生至今,低压油路中存气导致难以启动的问题一直是困扰行业和使用者难题所在.滤清器上增加油泵形成预供油滤清器,集泵油排气、燃油滤清功能为一体,具有极高的泵油辅助能力.但是,该型预供油滤清器机械固定时间开环泵油,存在轨压过高等问题,进一步影响发动机性能.本文从预供油滤清器、电子输油泵的工作原理及其控制逻辑出发,提出一种闭环燃油预供油方式,便于高效的判断故障原因,避免滤清器预供油而导致的轨压过高问题.
在国家不断加大扶持职业教育,学校鼓励教科研发展的环境下,为了更好的为地方产业服务,在交通运输教学部汽修专业实施的以职业岗位能力为导向的教学模式,并在《汽车机械基础》这门课程进行课程改革,与当地优质企业进行校企合作,采用校内教学和周末校外见习模式,实践见真知,取得了很好的教学效果.同时学生掌握信息的渠道越来越多,传统的课堂教学模式已经不能满足现代化的教育教学模式,为了更好的在课堂吸引学生的注意力,改变满堂灌的传统教学模式,以学生为主,老师引导的教学模式,课程改革取得良好的效果,学生学习动手能力得到提升,用人
根据无析锂和析锂锂离子电池在不同温度下电化学阻抗谱变化趋势,应用等效电路模型分别拟合电化学阻抗谱中的Ohm阻抗和固体-电解液界面阻抗,提出了EIS-Ohm法和EIS-SEI法,利用扫描电镜和化学方法对析锂检测方法进行了验证.随着温度升高,析锂电池的电化学阻抗谱中的Ohm阻抗先增大后减小,固体-电解液界面阻抗变化较小;扫描电镜观察和化学方法确定了电池电极表面析出锂金属形貌和化学变化特性.结合电池工作温度(-10~60℃)和检测时间(>21 min),讨论了2种析锂检测方法的可行性.结果表明:基于电化学阻抗谱
近年来,人们对高速、大容量传输系统的需求的日益增加,相干通信技术的研究已经成为了光通信领域的主流。同时,伴随着相干探测技术和高速模数变换器(ADC)等数字信号处理技术的飞速发展,人们对基于现场可编程门阵列(FPGA)的相干光通信系统的研究也越来越重视。目前,基于数字信号处理(DSP)的高速实时化并行算法已经成为人们研究和扩展的重点。本文主要完成相干光通信系统中载波相位恢复(CPR)算法(包括频率偏
探究了在车辆结构碰撞中腿型冲击器与真实人体响应的差异性.选择了高生物逼真度冲击器和更科学的、可反映实际碰撞事故中人体损伤情况的评价方法.在轿车和运动型多功能车(SUV)车型上,运用有限元方法,分析了3种腿型冲击器和人体模型动力学响应情况;对比了小腿、大腿、膝关节以及骨盆部位的损伤指标.结果表明:先进行人腿型(aPLI)中膝关节内侧副韧带腿型(MCL)比柔性腿型(Flex-PLI)的生物逼真度更好;aPLI腿型的大腿弯矩比刚性腿型(TRL)生物逼真度更好;但aPLI腿型对SUV车型发罩前缘对骨盆造成的损伤评
来日岁华好,万象始更新.rn值此2022年新年来临之际,中国汽车工业协会谨向长期关心和支持汽车产业发展的社会各界人士,致以最为诚挚的问候,并送上真诚的新年祝福!
为了在温带、寒带地区推广燃料电池汽车,研究了含20片单体电池、活性面积为285 cm2的石墨基双极板聚合物电解质燃料电池短堆的零下启动.开发了基于实车的使用交互氢泵的电源系统;对短堆阳极和阴极同时供应氢气;用低温环境舱来构建-30℃环境;以起始膜—水(分子数)含量、交互电幅值及频率等作为3个控制参数,实现燃料电池短堆-30℃启动;测试了短堆零下启动前后的极化曲线.结果表明:燃料电池短堆-30℃启动后,中心位置的单体电池可在80 s内温升至0℃;在其余位置,可在200 s内温升至0℃;零下启动前后的极化性能
汽车发动机属于汽车动力引擎,具有心脏的作用,汽车发动机稳定性与质量和汽车驾驶可靠性具有密切关系.在对汽车发动机机械故障检测过程中,使用非接触式检测技术能够使故障检测效率与精准度得到提高.以此,本文对汽车发动机机械故障的非接触式检测技术进行分析,促进非接触式检测技术的应用普及.
不同的充电机制会影响锂离子电池的充电时间、循环寿命和安全性能.锂离子电池充电普遍采用阶梯式充电策略.研究并选取合适的充电策略将提高锂离子电池的经济性,在保证安全性能的前提下降低电动汽车用户对于充电时间的焦虑.锂离子电池在充放电过程中,由于锂离子的嵌入和脱嵌,会导致正极负极活性材料损失(LAM)和可用锂离子存量损失(LLI).通过容量增量分析方法(IC)结合扫描电子显微镜(SEM),X射线光电子能谱(XPS)分析,研究了不同充电机制对锂离子电池老化行为的影响,研究发现两种策略对电池老化的机理相近,但不同充电