【摘 要】
:
抓取显著性图是探索人类抓取技能的重要分析工具,它通常反映了在日常生活中人们对于某一物品不同部位之间的抓取倾向。对同一个目标对象来说,它的某个部位显著性越高,代表人类更习惯或者更倾向于选择该部位来完成抓取操作。抓取显著性在视觉和机器人领域有着许多潜在的应用,例如可以协助机器人完成对目标对象抓取点的选择,从而更好更快地完成抓取等操作。为了得到抓取显著性图,通常需要借助数据集来完成实验的设置、操作及后续
论文部分内容阅读
抓取显著性图是探索人类抓取技能的重要分析工具,它通常反映了在日常生活中人们对于某一物品不同部位之间的抓取倾向。对同一个目标对象来说,它的某个部位显著性越高,代表人类更习惯或者更倾向于选择该部位来完成抓取操作。抓取显著性在视觉和机器人领域有着许多潜在的应用,例如可以协助机器人完成对目标对象抓取点的选择,从而更好更快地完成抓取等操作。为了得到抓取显著性图,通常需要借助数据集来完成实验的设置、操作及后续处理等过程,所以抓取数据集的质量和内容在很大程度上直接或间接地对抓取显著性图的结果好坏造成了影响。对于机器人抓取来说,精密的视觉系统与灵活机械臂的配合,才能完成一次完美的抓取。虽然目前的机器人抓取技术已经相对完善,但还是存在很多问题,例如抓取路径规划不流畅导致机械臂过于僵直、抓取操作诡异,面向未知物体时不能选择较好的抓取点完成抓取等。人手在完成抓取操作时是一个连续且十分自然的过程,所以让机器人的抓取操作拟人化也成为了我们追求的目标。作为抓取和操纵的基础,人手在接近目标过程中的运动轨迹是十分重要的,现有的抓取数据集都只是侧重于对抓取时接触点的获取,忽视了抓取时手部的形态、位姿以及抓取时的运动轨迹,并且数据集采集的环境设置较为单一,这让数据集缺少了多样性。对于抓取显著性图,之前的学者们已经得到了比较完善的模型的抓取显著性训练集(例如通过目标跟踪、热成像仪等方式记录抓取接触点),再通过深度学习等方法已经能实现对未知物体显著性图的预测,但由于使用的数据集较为单一,导致对未知物体进行的预测也较为局限,当外界条件发生改变时,前人的工作并不能很好地进行预测。针对以上问题,本文构建了多样性丰富的抓取数据集,并基于该数据集训练神经网络对未知物体抓取显著性进行预测,克服了之前工作的数据集单一、预测结果十分局限的缺陷。具体来说,由于考虑到面向机器人抓取路径规划、抓取点的选择及抓取操作拟人化等因素,我们召集志愿者并制作了抓取数据集,其中不仅记录了抓取时手部关节、接触点等信息,还记录了抓取前手部运动的轨迹信息;对于同一组模型,记录了在不同高度和不同角度下的抓取信息。通过对采集的数据进行筛选和处理后计算得到该模型的抓取显著性,再将已知模型的抓取显著性等信息利用PointNet++进行深度学习,最终实现了能够对未知模型进行更多样的抓取显著性的预测。
其他文献
电子商务的蓬勃发展,带动了服装行业的快速发展,这也造成了互联网中服装商品数据(衣服图像、文本描述等)的爆炸式增长。为了有效解决互联网中服装数据过载的问题,帮助用户快速、准确地搜索理想的服装商品,基于图像的服装检索方法应运而生并被广泛应用在搜索引擎、在线购物等系统中。该方法允许用户简单地上传一张描述其需求的服装图像来检索满意的服装商品。然而在现实场景中,用户很难获取一张完全满足其需求的查询图像。用户
随着互联网技术的发展,用户娱乐需求旺盛,越来越多的在线视频网站兴起,如爱奇艺、腾讯视频等,其用户规模与视频资源在逐步扩大。相较于传统的电视节目,在线视频网站给予用户更多选择权,能够依据自身兴趣偏好选择视频观看。但是并非所有视频资源都是免费的,相当多的电视剧或电影资源需要用户付费成为会员之后才有权观看。为享受更多更优质的视频资源以及更良好的观看体验,越来越多的用户购买会员服务,但是用户是否购买会员往
近年来,随着互联网的发展和多媒体设备的普及,不同种类搜索引擎和社交媒体应运而生,人们越来越倾向于用不同模态的数据表示同一事物,人们对于进行模态间搜索的现实需求越来越大,跨模态检索方法研究成为人们急需面对的重要议题和热门研究课题。该方法旨在通过计算不同模态数据之间的相似度,为给定的某种模态的查询数据,检索出与其内容相关的其他模态的数据。由于低存储成本和快速的查询速度等优点,跨模态哈希检索方法能够有效
能源是人类社会赖以生存和发展最重要的物质基础之一,能源的开发和利用贯穿了人类社会的发展历程。然而,随着社会的发展,能源需求急剧增长,某些领域能源危机愈发频繁,能源短缺问题逐渐成为制约社会发展的关键因素之一。因此,“节能降耗”被世界各国提上了日程。在众多的能源类型中,电能在社会生产和日常生活中扮演了越来越重要的角色,因此电能节约是推进节能降耗工作的重中之重。与此同时,电能的广泛使用也带来了潜在的用电
青年就业是世界性难题,我国也不例外,以高校毕业生为主的青年就业压力将依然突出,青年就业难、失业率居高不下的问题引发社会高度关注,在这一形势下,以创业带动就业对缓解青年就业问题具有重要现实意义。各地团组织要牢牢把握住团的主要生命力即为青年,只有做好青年工作,特别是就当前针对青年就业创业而言,只有做好服务青年就业创业工作,才是彰显共青团群众性最重要的方面。较山东省其他县区而言,广饶县作为全国百强县,工
传统推荐系统通常根据用户的身份标识信息和用户在此网站长期的历史交互行为来构建用户的画像特征,以便充分挖掘该用户的兴趣,并向该用户进行个性化的推荐。这些方法通常只关注用户的长期静态偏好,将用户的历史交互序列分解为多个静态的用户-物品记录,忽略了用户偏好随时间的转移。此外,在某些场景中,用户的身份标识信息可能无法利用。例如,一些用户非常重视隐私问题,通常情况下会拒绝提供本人相关的身份标识信息,或者通过
在多媒体领域中,视频场所类别预测任务受到研究者们广泛的关注,例如个性化餐馆推荐、旅游路线规划、视频场所地点验证等工作。随着手机、平板等可携带设备的发展和推广,越来越多的用户使用这些设备拍摄视频来记录自己的生活,并分享到社交媒体平台。考虑到个人隐私保护问题,大部分人在分享时都不会提供地点信息和行程记录,这就阻碍了视频场所类别预测任务的开展和推进。现在,大部分视频场所类别预测工作都是利用多模态信息或者
现如今点云是无人驾驶、机器人系统、虚拟现实等多个领域广泛应用的数据源之一,而特征提取是点云处理与应用的必要环节。由此,点云的特征提取算法成为了计算机视觉领域的研究热点。随着深度卷积神经网络在二维计算机视觉中不断取得突破,许多研究人员开始考虑将其迁移到点云中使用。然而直接使用深度卷积网络处理点云数据存在一个问题:点云是无序的,即数据的完整表示与数据输入的顺序无关,而卷积网络适用于有序的数据结构。目前
目的:1.通过数据挖掘技术中关联规则和复杂系统熵聚类方法,对全国老中医专家学术经验继承工作指导老师魏连波教授治疗慢性肾衰(CRF)的临床用药规律进行探析,寻找魏连波教授治疗CRF的高频药物及核心药味组合;2.通过构建CRF大鼠模型,实施药效学实验,对核心药味组合与魏连波教授治疗CRF的“肾衰方”进行比较,并分析不同剂量的核心药味组合对CRF的治疗效果。同时,基于网络药理学方法,筛选核心药味组合治疗
图像分类任务作为计算机视觉领域的一项基本研究任务,其研究成果的实际应用将为人类生活带来极大的便利。目前,虽然图像分类技术在自动驾驶、医学影像分析、智能安防等领域的研究已经得到了巨大发展,但也面临着诸多的困难。而细粒度图像分类任务是图像分类任务中的一项重要组成部分,研究目标是对图像中的目标物体所属子类别进行精确的识别。由于细粒度图像存在子类别之间差异较小,而子类别内部物体因拍摄角度等原因造成较大差异