【摘 要】
:
人机交互方法在大量以陆地为主要背景的数据集上取得了令人满意的研究成果,但目前该领域的研究几乎全部集中于陆地环境。本文期望能够丰富人机交互领域中单一的研究环境,在特殊的水下环境中完成面向潜水员与机器人间的交互研究。然而水下环境固有的不稳定性导致很少有针对水下人机交互而专门构建的数据集,同时也限制了相关工作的发展。如何针对该领域展开潜水员和水下机器人之间的交互研究是一个具有挑战性的问题。考虑到声呐、电
论文部分内容阅读
人机交互方法在大量以陆地为主要背景的数据集上取得了令人满意的研究成果,但目前该领域的研究几乎全部集中于陆地环境。本文期望能够丰富人机交互领域中单一的研究环境,在特殊的水下环境中完成面向潜水员与机器人间的交互研究。然而水下环境固有的不稳定性导致很少有针对水下人机交互而专门构建的数据集,同时也限制了相关工作的发展。如何针对该领域展开潜水员和水下机器人之间的交互研究是一个具有挑战性的问题。考虑到声呐、电磁波等传输信号在水下的传输距离受限,尤其在执行某些带有即时性位置转移的任务时,仅依靠人类单独执行水下作业有时是困难的。因此本文的研究基于一个同时包含潜水员和水下机器人的原始数据素材,从增进该水下机器人对潜水员航向理解的角度出发来辅助潜水员完成各种任务,进而促进水下人机交互研究的发展。基于以上出发点,本文的主要工作如下:(1)参考陆地上的标准人类活动数据集,本文重定义了潜水员关键点及骨骼连接方式,构建了一个针对水下特殊环境的新颖的潜水员数据集。后续基于该潜水员数据集进行图像质量增强及姿态估计等任务时,均能达到与标准人类活动的COCO数据集相似的实验效果,表明本文构建的潜水员数据集是健壮且稳定的。(2)针对如何为下游任务得到质量更好的输入图像问题提出了一个面向潜水员数据集的两阶段图像处理方法。第一阶段对潜水员图像进行像素拉伸或通道转换,第二阶段基于深度学习的思想改善潜水员图像固有的蓝绿色偏差问题,以此增强潜水员图像在后续任务中的特征学习能力。比较于仅使用深度学习方法的模型,本文所提方法将增强后潜水员图像的PSNR指标值提升了4%~9%,且在这三项水下图像处理领域中常用的指标PSNR、SSIM和UIQM上均得到了远超出使用其他方法得到的结果。实验结果表明,该算法能够充分减少图像噪声,在提升图像信噪比和保留结构相似度的同时,极大地提高增强后图像的整体质量。(3)为促进水下人机交互领域的发展,提出了一个基于潜水员姿态估计的水下人机交互方法。该方法针对潜水员骨骼和轮廓信息设计关键点获取算法得到潜水员的完整姿态,利用姿态信息预测潜水员下一时刻的航向,进而让水下机器人预判潜水员航向,实现水下人机交互的任务。在人体关键点检测任务上得到了0.88的关键点相似度,该结果较本人前期工作中已发表的SCI论文所取得的结果高出3个百分点。大量实验结果表明,本文提出的基于潜水员姿态估计的水下人机交互方法能够鲁棒并准确地识别潜水员的水下姿态,进而即时且稳定的完成潜水员航向预测任务。
其他文献
磷矿伴生稀土元素是获取稀土资源的重要途径。我国磷块岩型稀土矿分布广,稀土含量高,具有综合回收价值,是仅次于独立稀土矿床的伴生稀土资源。本文主要研究云南安宁磷矿中稀土元素分布规律和赋存状态,并比较了磷矿石中稀土元素总量与磷含量的关系,结果表明磷矿石中稀土氧化物总量为72×10-6~1 050×10-6,与磷含量呈一定的正相关关系。另外通过光学显微镜及电子显微镜观察发现,安宁磷矿中缺乏独立的稀土矿物,
糖尿病视网膜病变是成年人低视力和致盲的主要原因。一个合理的体外模型不仅能模拟疾病的发生发展机制,而且能减少经济投入,因此筛选和构建合适的体外模型是研究的关键。论文围绕糖尿病视网膜病变探讨了炎症反应、细胞凋亡、血管功能障碍和神经血管单元的破坏等相关机制,总结了内皮细胞、周细胞、视网膜色素上皮细胞、神经胶质细胞等建立的几种模型,以期为糖尿病视网膜病变机制研究及相应的药物研发提供有益的参考。
黑色素瘤是一种典型且严重的皮肤病,黑色素瘤死亡率高。当前,医学影像深度学习的快速发展推动了医学辅助诊断效率和准确性的提升。基于计算机视觉技术的自动黑色素瘤分类技术作为一种有效的早期诊断筛查工具具有广阔的前景,可以帮助医生快速筛选出可疑病变,有助于提高活检或手术的工作效率。各种新技术的发展以及数据集的增长,为近年各种分类算法的快速发展提供了支持,在多个医学任务上达到专业医生的判断水平。但医学领域的深
近年来,为了应对互联网中每天爆发性增长的信息量,并且在海量数据中挖掘用户的兴趣点,研究者们提出了一系列的推荐模型以及智能化的推荐系统。随着深度学习的发展和引入,研究者们对推荐模型进行了进一步的研究,其中从用户行为序列中挖掘用户的兴趣偏好进行推荐是当今关注的重点。用户行为序列具体表现为用户对历史浏览物品的点击记录、评分记录,购买记录等序列信息,从中可以挖掘到用户兴趣的动态变化,并更精准地向用户推荐喜
<正>鸡滑液囊支原体病(MS)一直是危害我国肉鸡生产业的重要疾病,此病自发生以来一直困扰着我国的肉鸡行业与从业者,近年来此病的发生更是呈现越来越频繁及严重的趋向。由于种禽场对疾病的净化不够彻底,加上行业内对饲料添加剂的管控越来越严格,促生长类抗生素的禁用以及目前疫苗的临床使用效果不甚理想等问题,寻求适合的药物及合适的使用方法对于目前生产者来说显得尤其重要。1病例介绍当前肉鸡发生滑液囊支原体病的病例
青光眼是当今排名第二的致盲性眼病,更是不可逆性致盲眼病之首。在病变过程中,患者视力水平往往是渐行性且不可逆的缓慢损伤,绝大多数患者无明显症状,直至视力遭受严重损害后才能发觉,因而青光眼又被称为“沉默的视力窃贼”。青光眼无法预防,只能通过及早发现、及早治疗,进而阻止病情继续恶化,这一举措可以有效降低患者的失明率。但目前眼科医生数量依然匮乏,尚无力支撑大规模的青光眼筛查。在临床检测中,医疗影像可以有效
据相关研究调查显示,高血压、糖尿病等慢性疾病在近年来呈快速增长趋势,临床医学研究发现这类疾病症状表现与视网膜密切相关,视网膜血管的异常扩张或阻塞、炎症反应等症状为医生的诊断提供了重要的依据,计算机图像处理技术为诊断提供了新的思路,本文旨在研究一种辅助医生诊断的眼底图像分割方法。近年来,卷积神经网络被大量应用于图像处理任务中,依据特定的分割任务来设计网络框架能达到良好的分割效果。利用U-Net网络架
精准施肥是精准农业重要的一环,也是推进建设农业现代化的核心之一。对于土测含量和产量与施肥量之间的复杂非线性关系,传统的精准施肥手段常常难以得到准确的目标预测值。且获取实际农业数据所需周期长,获取到的实际样本有数量少,不平衡的特点。为解决上述问题本文提出了基于贝叶斯回归网络的同构集成和异构集成学习方法,贝叶斯分析是一种经典实用的统计学方法,在许多领域广泛应用。这种方法可以结合先验信息和全部样本的数据
在信息全球化的大背景下,移动通信的发展突飞猛进,云计算、区块链、大数据等创新技术极大地改变了人们生活、工作与交流的方式,同时,随着5G+垂直行业的新型服务及应用不断出现,如:自动驾驶、智能家居、远程医疗等,人们对网络传输速率、网络可靠性等性能提出了更高的要求,因此,需要多种制式网络相融合来促进网络的“互联互通”体系。为了实现异构网络间无缝漫游,5G多连接技术成为国内外的研究热点,使用户设备同时与多