基于零样本学习的手持物识别技术与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:czqmip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年世界各地恐怖暴力事件频繁发生,对人身安全和社会稳定造成极大的影响,为此在公共场合下自动地、高效地通过监控摄像对恐怖分子所使用的危险手持物进行及时识别势在必行。危险手持物识别作为手持物体识别的一个重要场景,基于不同场景下的图像手持物识别算法研究具有重要意义。实际运用中,手持物识别通常利用基于监督学习的目标识别算法,使用大量的标注样本训练视觉分类器来检测,然而手中所持物体类别往往不可预知并且种类巨多,难以大量收集每一类别物体图片并进行标注。并且具体图像中大部分手持物体小、有遮挡,识别算法无法获取图像中全局结构信息进而对遮挡的各类手持物体进行高精度识别。针对上述问题,提出基于隐空间图网络的全局推理模块和面向人物交互的零样本目标识别算法。具体内容如下:(1)提出了基于隐空间图网络的全局推理模块。针对目标识别算法中提取特征的骨干网络只能获取图像中局域信息无法对图像全局结构信息进行捕捉的问题,提出场景下的基于隐空间图网络的全局推理模块,对图片上一层卷积得到的特征映射至隐空间,再对隐空间上的节点特征进行多层次的聚合获得物体之间的深层次关系并在图上进行传播学习,最后所得特征整合了全局结构关系,提升了具体场景下不清晰有遮挡等问题的手持物识别率。(2)提出了面向人物交互的零样本目标识别算法。人与物体之间的关联关系可以作为图像识别中上下文类别间的信息辅助,针对零样本目标识别算法中知识的迁移未考虑物体与人类行为之间关联关系的问题,提出通过将人物交互知识模块融入至基于知识图谱和图网络的零样本目标识别算法中进而加强人物之间关联,并整合基于隐空间图网络的全局推理模块,提升对不同类别手持物体的识别准确率。(3)设计并实现了危险手持物识别系统,将本文提出的基于隐空间图网络的全局推理模块和面向人物交互的网络模型应用到具体的危险手持物体识别场景中,测试并展示了对图片中不同类别危险手持物的识别效果。
其他文献
声纳图像作为准确获取水下信息的重要途径之一,在国防、军事、工程等方面发挥着巨大作用。然而,由于水声信道的复杂多变和声波本身的传播损失,声纳图像往往呈现出分辨率和对比度不高、噪声干扰严重、目标轮廓模糊等特点。虽然对于光学图像的预处理和分割已有大量效果很好的算法,但研究针对声纳图像特点的处理方法仍是极具应用价值的。本文主要聚焦于声纳图像预处理中的去噪、增强两个方面和声纳图像分割方法,开展了以下研究工作
如今不同科学技术发展迅速,在当前时代背景下医疗影像技术也有了飞速的进展,医疗影像在临床诊疗、教研科学等方面具有重要的作用,分析解读医疗影像同时书写对应的报告是当前诊疗过程中不可缺少的步骤。医疗影像的分析和解读是一项具有挑战性的工作,医生有可能会因为劳累或缺乏足够的经验而出现错误分析,造成疾病漏诊误诊的问题,导致病人错过最佳治疗时机;而对经验充足的医生而言,这是一项费时又枯燥的工作,且造成了医疗资源
阿尔茨海默病(Alzheimer’s disease,AD)是一种常见的神经系统疾病,多发于六十周岁以上的老年群体。其临床表现为记忆力、理解力、执行功能等多种认知功能障碍。由于当前并没有针对此病症的特效药物,要治愈阿尔茨海默病十分困难,提前进行预防就显得尤为重要。随着我国逐渐步入老龄化社会,对阿尔茨海默病患者的早期防治刻不容缓。在计算机技术保持发展的当下,基于磁共振成像(Magnetic Reso
近年来,我国越来越重视农业品牌建设。从2016年起,中央一号文件多次提出推进农产品品牌化建设。陕西作为农业大省,各地市特色农产品数量多、质量优,创建一批具有鲜明地方产业特色、生产经营规范、在市场上具有较强竞争力的农产品品牌,对于推动陕西农业发展、促进农民增收具有很大的意义。但是,由于农产品区域品牌建设是一项系统工程,如果仅仅依靠企业,就存在资源配置不均、资金技术力量有限、规模优势发挥不明显等问题,
三维重建技术作为计算机视觉中一个热点研究方向,在社会生产生活如无人驾驶、医疗诊断、考古挖掘等领域发挥着重要的作用。和其它三维重建技术相比,利用反射光偏振信息恢复目标物体三维模型的方法,能够使用低成本的设备完成高精度的成像任务,受到了越来越多科研人员的关注。本文从反射光的偏振特性与表面法线的关系出发,提出了一种利用漫反射光偏振信息恢复物体三维模型的方法。该方法结合双目视觉重建技术获取物体初始点云作为
知识图谱技术应用在不同的行业中其中包括教育行业,而数学是教学的重点。数学学科具有很强的结构性,数学知识点之间构成体系,本文通过提出一种数学知识点特征的知识图谱构建方法,并把知识图谱运用于数学题目的知识点特征提取研究,最终实现数学知识点特征自动提取系统,本文主要的工作如下:构建了基础概念知识图谱与数学知识点体系图谱。基础概念图谱根据数学语言中涉及的数学实体以及实体间的关系来进行构建,实体有551个,
近些年来,随着神经网络的迅猛发展,目标识别技术也随之在精度和速度上都得到了快速提升,进而被广泛应用在灾难救援、军事打击、视频监控等领域。传统的线下目标识别通常是分阶段式处理的,即首先将获取到的影像拷贝至本地计算机,然后再将目标进行识别,最后把识别到的目标发送给需要的用户。这种方式已经不满足当下的发展,尤其是军事打击和嫌疑追踪这种识别精度和实时性要求高的领域。随着无人机载重的提升、嵌入式设备的更新,
新生活运动(简称新运)是时任国民政府军事委员会委员长的蒋介石于1934年2月19日在江西南昌发起的一项大型国民教育运动。新运一经推行,其主要载体新生活运动促进会立即成立(1934年7月1日升格为新生活运动促进总会),并由蒋介石亲自担任会长。新运从发起到1949年国民党内战失利后暂停办理,在中国大陆持续了十五年之久,作为一项运动,从时间跨度和规模范围来看,它是罕见的。在这十五年当中,中国发生了巨大变
随着科技的进步和人工智能的发展,互联网和信息技术在生活中得到广泛应用。说话人识别聚类是语音信号处理的一个研究方向,它的任务是在多个说话人分时说话的语音音频文件中识别说话人边界和说话人身份,使得相同的说话人被标记为同一类,且每一类中只包含一个说话人。说话人识别聚类通常使用说话人的嵌入向量来聚集音频片段,如i-vector。近年来,由于深度学习的快速发展,基于深度网络的d-vector嵌入向量在这个领
随着物联网和各种云计算模式的兴起和发展,越来越多的用户将数据上传至云服务器来享受便捷的数据备份和共享服务。但是,随着云上数据的指数级增长,如何保护用户数据的安全性和完整性是云计算模式面临的最大挑战。属性基加密(Attribute-based Encryption,ABE)作为一种新型的公钥密码学加密原语,由于其可以提供细粒度的访问控制模型和灵活的一对多加密技术,从而成为解决云数据安全问题的一个有前