基于计算机视觉的物体抓取识别算法的研究与实现

来源 :上海师范大学 | 被引量 : 3次 | 上传用户:wareware1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉技术是人工智能的主要研究方向之一,随着图像或者视频的数据规模快速增长,以及计算能力的提升,计算机视觉技术在近几年获得了前所未有的发展,被广泛应用于多种场景,如无人驾驶,人流监控等。为了挖掘人工智能技术的应用潜力,笔者将其成功的应用了到无人零售场景。本文设计了一种物体抓取识别算法,该算法基于深度学习和计算机视觉技术,能够在目标被抓取的状态下,识别目标物体的个数和种类,可用于识别零售场景中顾客抓取的商品。它包含三个算法模块:立体匹配、物体识别和行为识别,其主要内容如下:为了让目标物体多角度的暴露在视野范围内以获得多角度的信息源,并避免单摄像机被遮挡以至算法完全失效,本文采用了多摄像机的架设方案,设计和实现了一种快速立体匹配算法,该算法利用双目相机的对极约束条件以及动态规划,能够在线性时间内完成匹配,在多个相机之间定位同一个物体。物体识别算法是本文的核心,零售场景需要识别出目标的种类及相应的个数,尽管目标检测算法可以实现这一目的,但是需要大量的标注成本和计算成本。本文使用弱监督学习的模型训练方案,设计了一种深度卷积神经网络和一个计数损失函数,不需要标注目标物体的位置信息,就可以识别出图像中目标物体的个数和类别。并且,笔者为这一视觉识别任务设计了一种评估指标,较传统的精确率和召回率相比它更为严格,在笔者提出的数据集下,实现了94.6%的准确度,模型的前向时间仅需3.87毫秒。行为识别采用双流神经网络,提取视频的空域信息和时域信息,识别出目标顾客在商店中做出的购买行为。最后,笔者设计了一种视频数据的自动标注算法,它利用插值算法和卷积神经网络能够准确的预测目标的标定框,大幅地降低人工标注成本。
其他文献
本报告是一篇英译汉翻译实践报告,所选文本为儿童教育作品——《学龄前儿童阅读与写作》(第一章到第二章)。译者参考了其它儿童教育作品的翻译文本及相关翻译策略,并在实践过
在一般注塑机上采用“镶嵌熔接”的方法生产复合结构的录音带盒可以赶上进口带盒的新式样。先单独注射成型透明的嵌片,生产黑内盒时,在合模前用手工将嵌片安放在模具型腔上,
观注意器物造型,一般来说老瓷古朴、形态自然,并具有某个时代的风格特征。同时观察画工是否精致,古瓷釉面富有层次感,花卉、飞禽栩栩如生,人物神态自然,带有时代韵味,形神兼
第一部分 高效液相色谱串联质谱技术测定血液、尿液中百草枯浓度目的:优化一种利用电喷射接口串联超高液相色谱仪及高分辨质谱仪测定血浆、尿液中百草枯浓度的方法。进而精确
2016年12月11日,中共中央办公厅和国务院办公厅印发了《关于全面推行河长制的意见》。在《意见》的指导下,全国各地相继推出了辖区内河长制实施方案,其中的工作目标尤是各地
通过对荣成市气候条件与大花生种植适宜的环境条件分析,得出荣成市气候条件非常适宜大花生生长。为促进大花生产业的稳定、可持续发展,应充分了解和掌握当地气候变化规律,合
目的:对比分析高粘度骨水泥与普通粘度骨水泥PVP(percutaneous vertebralplasty,经皮椎体成型术)治疗骨质疏松性椎体压缩性骨折(osteoporotic vertebral compression fractur
近日有消息称,我国已试运行并即将正式上线新版个人征信报告,新报告将更加细化,包含个人水费、电费的缴费情况等。针对这些情况,中国人民银行相关负责人4月22日表示,目前征信系统
报纸
研究目的:随着全球范围内的运动健身热潮持续高涨,快走运动因其参与简单,且锻炼效果明显而受到欢迎。因此对不同运动条件下(上坡或下坡)快走运动下肢关节关节角特征的分析对
近日,山东青岛市政府发布地方性规章《青岛市中小学校管理办法》,《办法》提到“中小学校对影响教育教学秩序的学生,应当进行批评教育或者适当惩戒,学校的惩戒规定应当向学生公开
报纸