基于深度学习的人与物体交互行为检测研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:chcespring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代的发展带来了海量高复杂度的图像数据,促使计算机视觉衍生出非常多的子课题,随着深度学习在计算机视觉领域应用的发展,许多课题已经取得了很好的成绩,比如图像识别、人脸检测和识别、目标检测等,但一些较为复杂的课题,如研究图像内人与物体交互的课题尚未取得突破。信息时代最为关注以人为中心的计算机视觉课题,因此人与物体交互行为检测有着广泛的应用领域。本文针对现有的人与物体交互行为检测存在的不足展开研究,主要研究工作如下:(1)针对现有主要方法忽视或没能足够有效利用人与物体的局部细节信息问题,提出了一种全新的基于注意力机制的人与物体交互行为识别方法(HumanObject Interaction Recognition Based on Attention Mechanism,HOIR-AM),HOIRAM方法首先使用注意力机制提取视觉特征,使视觉特征不仅包含人与物体实例级别的特征,还包含人与物体感兴趣的局部注意力特征,为区分出各类交互行为提供更细粒度的有效信息,HOIR-AM方法再利用人与物体相对位置关系提取位置特征,最后使用视觉特征与位置特征的融合进行人与物体交互行为识别。在目标检测算法配合下,HOIR-AM方法在V-COCO数据集上取得了46.62的检测平均准确率。(2)针对现有方法和(1)中方法先利用目标检测器检测出人与物体,再使人与物体实例一一组合进行交互行为识别所导致的匹配效率低的问题,提出了一种基于交互匹配网络的人与物体交互行为检测方法(Detection of HumanObject Interaction Based on Human-Object Interaction Matching Network,HOIDHOIMN),HOID-HOIMN方法先利用交互匹配网络先对人与物体组合进行有无交互行为识别,再使用HOIR-AM方法完成交互行为识别,最终在目标检测算法配合下,在V-COCO数据集上取得了46.69的mAP,高于HOIR-AM方法,且识别耗时较HOIR-AM方法降低了12.7%。(3)针对(1)和(2)中先进行目标检测再进行交互行为识别导致的步骤繁琐、耗时较长的问题,设计并实现了一种基于HOID-HOIMN的交互行为检测系统(System of Human-Object Interaction Based on HOID-HOIMN,HOIS-HOIDHOIMN),通过使用特征共享解决特征重复提取的问题,使目标检测、交互匹配和交互行为识别统一在一个框架下执行,实现了一步完成检测,取得了0.2 s/f的检测速度,有较好的实用性。
其他文献
通过太姥互通B匝道桥施工实践,介绍了软基地段非预应力钢筋砼现浇连续箱梁的主要施工技术方法和质量控制要点.
实施农村饮水安全工程是建设社会主义新农村的重要任务,也是目前我县农村基础设施建设中的薄弱环节。针对农村某一工程区农村饮水安全工程中存在的水资源分布严重不均衡、水资
针对目前园林工程的施工组织设计流于形式的情况,从绿色管理的概念出发,在研究园林绿化产业巨大的环境傈护与生态效益的基础之上,本文探讨了将绿色管理思想运用到园林绿化产业中
结合工程施工实践 ,简要介绍了三峡库区地质灾害防治工程中抗滑桩的桩孔开挖施工方法 ,论述了抗滑桩的施工安全要点
<正> 由中国地质科学院勘探技术研究所研究开发的、具有自主知识产权(获国家发明专利ZL99100660.7)的YZX127液动潜孔锤,在国家重点工程——中国大陆科学钻探工程“科钻一井”
港区道路与堆场常位于深软土地基上,沉降量大,提出一种提高港区道路与堆场承载力方法。通过现场试验段试验,采用贝克曼梁进行弯沉测定,分析研究土工格栅对提高港区道路基层结
目的:探讨利用停止曲在治疗前牙反拾中的临床效果。方法:选择2014年1月-2015年3月我院口腔科治疗的恒牙期前牙拾患者10例(男4例,女6例),年龄11~18岁。停止曲放置于第一磨牙颊面管处,
<正>一直以来,很多研究者都认为目标设置和目标追求过程是有目的、有意识的。个体根据各个目标的价值、难度等仔细地选择,并使用认为最佳的方式有目的地追求目标。然而,近年
随着游戏类别的不断丰富,以女性为消费群体的乙女向游戏开始在游戏市场中崭露头角,女玩家以全新的姿态积极参与到游戏文化的构建。本研究以《恋与制作人》为代表的乙女向游戏
介绍了硅油的特性,结合涤纶全拉伸丝(FDY)熔体直接纺生产流程,阐述硅油在生产的稳定性、满卷率中的重要性。通过试验,在硅油选型、铲板方式等方面提出建议,并逐一论证。