【摘 要】
:
随着人工智能技术的不断进步,智能化机器人已是时代发展的需求。机器人对于复杂的动态环境,需要像人类一样拥有感知、决策、行动的能力。本文根据操作问答任务的设计需求,借助相应的多模态任务数据集,利用人工智能算法,构建一套集合视觉、听觉的机器人感知决策行为框架,从仿真环境和实际场景验证本文的协作机器人系统的先进性和实用性。本文的创新性工作包括以下内容:(1)针对机器人系统的各个设备之间的特性构建一种模块化
论文部分内容阅读
随着人工智能技术的不断进步,智能化机器人已是时代发展的需求。机器人对于复杂的动态环境,需要像人类一样拥有感知、决策、行动的能力。本文根据操作问答任务的设计需求,借助相应的多模态任务数据集,利用人工智能算法,构建一套集合视觉、听觉的机器人感知决策行为框架,从仿真环境和实际场景验证本文的协作机器人系统的先进性和实用性。本文的创新性工作包括以下内容:(1)针对机器人系统的各个设备之间的特性构建一种模块化的机械臂操作平台,利用视觉传感器、听觉传感器收集外部世界的感官信息,结合ROS分布式操作系统构建通信节点联通各个设备,合理规划机械臂末端的运动控制,并且在仿真环境和实际场景都中构建了相应的操作平台。(2)提出了一种可迁移的强化学习操作问答算法,针对不同模态之间的特征融合,利用双线性池化融合算法捕获两种特征之间的细粒度映射,完成文本特征和图像特征融合。针对模型的迁移问题,使用域随机化算法,改变训练过程中的环境特征,结合循环对抗神经网络,完成仿真到现实图像域的迁移,最终在仿真环境和实际场景验证整个系统的有效性。(3)提出了一个新的视听操作任务,构建相应多模态数据集,利用视觉信息和音频信息解释指示表达的操作指令,对于带有特定目标的操作指令,结合图像信息,利用深度学习算法定位到指定的目标物体区域。针对视觉上难以区分的物体,增加听觉传感器,利用机械臂不同的摇晃动作获取物体碰撞的音频信息,构建相应的分类算法,完成音频识别,并且运用实际机器人进行验证,实验结果表明多模态数据对于机器人操作效率有着显著的提升。
其他文献
燃煤电厂排放的粉尘颗粒粒径小、浓度低、对社会具有重大危害,它会改变地球气候、降低空气能见度、引发人类的呼吸系统疾病。动态光散射法具有测量结构简单、测量粒径宽、响应速度快等优点,已成为颗粒物在线检测的重要手段。但燃煤电厂排放的颗粒物粒径大小、形状及成分各不相同,单个角度固定波长的动态散射光无法满足测量颗粒物的各项特性变化,难以实现颗粒物质量浓度的准确测量。基于以上问题,本文主要开展了以下内容研究:首
集成电路辐射是现代电子产品的最终干扰源,其电磁辐射通过电路板、线缆、产品缝隙等向外发射。对集成电路辐射的准确测试是发现电子产品电磁兼容问题的有效途径。近场测试是集成电路测试的关键技术,其中,近场探头性能决定了测试结果的准确性。近场探头可用于定位印刷电路板、线缆和产品缝隙上的电磁干扰源,对于近场探头的研究,不仅对近场测量系统的优化起着重要作用,也对电磁兼容标准的更新有着重要意义。本文针对近场探头带宽
随着计算机视觉的快速发展,语义分割作为计算机视觉的重要组成部分,在不同应用场景中取得了一定的成果。但是在无人机图像农田分割场景中,常用的语义分割方法在恢复农田边界和识别狭窄田埂方面的能力上有待提升。同时,语义分割网络丢失目标位置信息的问题越来越突出。本文针对上述问题,提出了两种语义分割网络,分别为多重注意力编解码网络和全局特征融合网络。本文主要工作如下:(1)针对无人机图像农田分割问题,本文制作了
随着全球气候变暖,气候预报业务变得很重要。在常规气候预报要素中,降水和温度是最受关注的两个,尤其夏季降水和冬季温度与我们的生活息息相关。同时,降水和温度也是影响干旱与洪灾的主要因素,准确地预报降水和温度是气候预测的一项重要任务。目前,气候模式作为主要的预报方式依然存在误差。因此,需要提高气候模式预测的准确率。在归纳全国不同区域降水的特点与现状的基础上,深入研究了机器学习相关方法。按照项目的要求,主
随着工业化进程的加快,全球气候变暖问题日趋严重。差分吸收激光雷达技术可用于大气中温室气体的探测,且具有较高的探测范围、空间分辨率和探测灵敏度,因此成为大气探测领域的重要研究方向。差分吸收激光雷达光源的频率稳定性直接影响其测量结果的准确性和复现性,是激光雷达研究中不可缺少的重要环节。本文基于差分吸收原理,搭建了路径积分差分吸收(Integrated Path Differential Absorpt
目标跟踪是计算机视觉领域的基本任务之一。虽然经过几十年的研究,在跟踪精度和鲁棒性方面已经取得了很大的进展,但由于许多不确定因素,如外观变化、遮挡、背景杂乱等,目标跟踪仍然是一个具有挑战性的问题。为了实现更高精度的跟踪,本文在传统相关滤波跟踪框架的基础上,通过结合现有的跟踪算法,做了以下一些工作:为了解决目标跟踪算法在面对遮挡、旋转等复杂场景下跟踪失败的问题,提出一种基于检测器与定位器融合的自适应校
基于高分辨率遥感影像进行震害建筑物检测,对开展应急响应救援及灾后重建等具有重要意义。目前,震害建筑物检测方法主要可分为基于经典机器学习和基于深度学习方法。前者采用用户定义的底层和中层语义特征,适用于小样本条件下的应用场合;后者则能够自动提取具有鉴别力和代表性的抽象特征,在训练样本充足条件下通常能够取得更加准确的检测结果。因此,两类方法在实际应用中各具优势,但同时又各自面临着不同的挑战。为此,本文分
我国在新一代信息技术发展方面的人才需求量大,人才素质要求高,实验教学对于培养实践创新型人才起到关键性作用。传统的实验箱实验固定、通用性低、场地制约,缺乏理论性和开发性,并且具有缺乏工程实践应用等缺点。受新冠疫情影响,很多线下实验也无法顺利开展。设计一个功能丰富、通用便携的实验系统具有一定的现实意义。针对上述问题,本文主要工作如下:首先,设计了一种基于FPGA的口袋实验室系统,该系统采用“固定配置+
二维材料是指厚度只有纳米级别的层状结构材料,由于电子只能在二维平面内自由运动,通常具有奇特的载流子迁移和热力学扩散特性,其出现极大的推动了材料领域的发展与进步,为电子、生物、航空航天等众多领域带来了更加优质的选择。Mo S2作为二维过渡金属硫化物(TMD)的代表,单层时具备直接带隙的能带结构特点,弥补了石墨烯没有带隙的缺点,在光电器件的应用领域拥有巨大潜力。在此基础上,本文通过化学溶液沉积法工艺在
射频接收机是微波应用系统中的关键功能电路。常规的变频式接收机都需要一个独立的本振源来提供本振信号,以完成与射频输入信号的下变频。而自振荡混频接收机则通过有源器件在特定工作条件下的振荡产生本振信号,同时利用有源器件的非线性特性完成混频,避免了独立本振源的使用,因而在成本、功耗、结构方面具有显著的优势。另外,如果将自振荡混频过程中的振荡信号加以复用,不仅利用其做内部本振信号以实现混频,还将其引出以作为