基于多模态信息的装配行为识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lichong0324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
装配行为识别技术对于监测工厂工人装配流程、提高产品的装配效率等方面具有研究意义和价值。通过引入惯性传感器采集装配人员双手手腕在装配过程中的运动信息,目的是改善纯视觉信息下由于遮挡、不完全拍摄和装配物件小等原因给行为识别带来的影响,从而来提高装配行为识别准确率。搭建了一套多模态信息装配行为识别数据采集系统,主要由相机和两个IMU惯性传感器分别采集装配过程中俯拍视频信息和装配员双手手腕的三轴运动加速度信息。三个传感器采用同时启动、在线同步方式获得在时间上完成对齐的样本信息。由于每一帧IMU信息与每一帧视频图像完成了对齐工作,对视频信息进行手动帧级的真值标注的同时,间接完成了对IMU信息的真值标注。利用搭建的多模态数据采集系统采集了两个不同装配目标的多模态数据集,Building Blocks Assembly数据集和Lego Assembly数据集。Building Blocks Assembly数据集采集了20名装配员装配积木过程的信息,积木的零部件较大、颜色差异明显,可用样本187个,8种装配类别,可以用来研究IMU信息对拍摄不完全画面的视频信息的补充作用。Lego Assembly数据集采集了30名装配员装配8款乐高的过程,乐高的零部件较小、颜色区分度小,可用样本960个,62种装配类别,可以用来研究背景复杂、遮挡严重情况下IMU信息对视频信息的补充效果。针对视频和IMU两种不同模态信息,由于数据维度特征的不同,在进行特征提取时,不同模态的数据采用的方法不同。视频数据通过ImageNet预训练模型加载到I3D网络的视频分支流进行特征提取。IMU数据则是通过3个1D卷积模块、2个卷积运算和3个池化操作对同一样本下的两个IMU数据分开训练再进行特征提取,利用对齐均值操作实现两个IMU特征在时间维度上保持长度与视频特征一致。分类网络可对视频特征、IMU特征以及融合后的多模态特征进行装配行为分类的训练和预测。分类网络主要采用1D的扩张卷积网络,在预测生成阶段使用10层双重扩张卷积层;预测细化阶段中,4个阶段中每个阶段使用11层扩张残差层。通过这种组合能够在保证准确率的同时还能保证相邻两帧之间的特征区分更加明显。通过利用采集的Building Blocks Assembly数据集、Lego Assembly数据集、公开数据集50 Salads及UTD-MHAD数据集对算法进行验证。通过对这四个数据集进行视频、IMU以及多模态之间识别效果的比较,根据实验结果证明多模态的识别效果优于单模态。分析Lego Assembly数据集中单款乐高各个装配类别的识别效果。利用本文在UTD-MHAD上各种模态的识别效果与之前的方法进行比较,验证方法的可行性。
其他文献
目的:图像分割是医学影像分析领域中的关键步骤之一,分割效率和结果的精细程度直接关系到临床治疗和科学研究的时效性与准确性,随着深度神经网络架构的进步和医学影像分割需求的提高,深度学习方法被广泛应用于在包括肿瘤分割在内的各种医学图像处理任务中。目前国内外使用深度学习方法对垂体腺瘤MRI图像进行分割的研究报道较少,本研究拟探讨基于卷积神经网络的深度学习模型对3D-CUBE T1WI对比增强MRI图像上的
学位
第一部分增强CT影像组学在浆液性卵巢癌FIGO分期中的临床应用价值目的探究腹盆部增强CT影像组学对浆液性卵巢FIGO分期的术前诊断价值。方法回顾性分析安徽省立医院2018年6月至2019年11月137例卵巢癌患者的术前CT资料,经手术及病理证实为浆液性卵巢癌,其中FIGO分期III期68例,IIIIV期69例。对每一例患者的术前CT图像(包括动脉期及静脉期)进行感兴趣区(Region Of Int
学位
操作条件与控制策略对固体氧化物电解池(SOEC)的电压、燃料利用率、温度、温度梯度等结果有着巨大的影响,不良操作条件造成的局部燃料饥饿或内部较大温度梯度是造成SOEC性能衰退的关键因素之一。由于高温原位测试技术的限制,数值模型是探究SOEC内部物理场分布的主要手段。然而,大多数已报道的SOEC数值模型仅通过I-V曲线进行验证,无法保证电极动力学和传质模型的准确性;在操作条件对稳态性能影响的数值模型
学位
步行在人类的日常生活中起着至关重要的作用,而中风、脊髓损伤、脑损伤、外伤及其他神经损伤可导致足下垂步态,表现为行走时的脚掌拍地和脚尖拖曳,使患者行走缓慢、肢间不对称、能量消耗高并且容易摔倒,对日常出行极其不利,显著降低生活质量。随着外骨骼技术在康复领域的应用与发展,踝关节外骨骼可以有效防止足下垂。然而目前研究较广泛的柔性外骨骼力矩控制性能较差,而基于串联弹性驱动器的外骨骼通过简单的位置控制就可以实
学位
【目的】去整合素金属蛋白酶12(A disintergin and metalloprotease 12,ADAM12)是一种必需的跨膜蛋白,具有金属蛋白酶、细胞结合和细胞内信号调节能力,在癌症中起着至关重要的作用。然而,ADAM12在胃癌中的生物学功能仍不清楚。本课题通过利用生物信息学分析与实验分析相结合的方法,对ADAM12在胃癌中的表达水平、预后价值、调控机制和生物学功能进行全面的研究,从而
学位
研究背景:吲哚菁绿(ICG)荧光影像技术近年来越来越多的应用于腹腔镜肝切除术,其作用包括探测肿瘤、肝段分界等,然而其在血管瘤中的染色特性及相比与传统腹腔镜解剖性肝切除的效果仍需进一步探究。研究方法:(1)收集2020年1月至2021年5月在我院收治的11例行ICG荧光联合三维可视化技术腹腔镜肝血管瘤切除的患者。所有患者术前根据三维重建结果拟定个体化手术方案,术前24~48h外周静脉推注12.5mg
学位
目的:肝癌是世界上最常见的恶性肿瘤之一,肝癌发病隐匿,患者就诊的时候往往为时已晚,在中国,针对这类晚期肝癌患者,以肝动脉化疗栓塞(TACE)为主的局部治疗是非常重要的治疗方法。TACE可通过向肝细胞癌的供血血管灌注化疗药物和栓塞剂来抑制肿瘤生长、阻断肿瘤部位的血供,诱导肿瘤部位的缺血和缺氧。然而研究表明,TACE术后残留肝癌组织中血管内皮生长因子(VEGF-α)明显增多,从而促进残留肿瘤血管生成。
学位
近年来,肠胃道疾病的发病率不断升高,这对世界各国都造成了极大的影响,早期及时有效的筛查治疗能够很好地预防此类疾病的发生和恶化,降低其致死率。利用无线胶囊内窥镜进行肠胃道检测可以极大地降低患者的不适感并提高检查的准确性和安全性,而这项技术应用的关键点之一是对胶囊机器人进行定位。由于外界环境磁场的干扰,现有定位方法只能保证患者在保持不动时对胶囊机器人进行较准确的定位,为了不对被检查的患者的正常生理活动
学位
背景:胰腺星状细胞(Pancreatic stellate cell,PSC)是一种在胰腺组织中存在的特异性间质细胞。在正常胰腺组织中,PSC主要呈静息态表型,参与维持细胞外基质平衡(extracellular matrix,ECM)。在各种理化因素的刺激下,PSC激活,具有类肌成纤维细胞样的表型。而活化态胰腺星状细胞在介导慢性胰腺炎(Chronic pancreatitis,CP)和胰腺导管腺癌
学位
研究目的:心力衰竭是目前临床上最常见的心脏疾病之一,是各种心脏病变的严重并发症和最终阶段。现阶段心力衰竭已经成为当代60岁以上的老年人群中反复住院和病死的关键原因之一,造成目前这种严峻现象的原因之一就是心力衰竭缺乏具备早期诊断、可针对性治疗以及预后评估能力的生物学标志物。而环状RNA是一类利用共价键将其首尾接合呈环形的内源性RNA分子,其结构稳定、进化保守、表达量高、表达特异性等特点使其具有成为生
学位