基于深度学习的端到端的目标检测与属性分析算法及其应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qinling88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像、视频等多媒体数据的高速增长,如何利用计算机对海量的多媒体数据进行自动和有效的智能分析和理解成为了人工智能领域的研究热点。对图像的数据分析需要解决两个基本任务,即视觉目标检测和属性分析。在深度学习技术的发展下,基于计算机视觉的目标检测和属性分析算法在近几年有了惊人的突破。然而,在现有的研究中,视觉目标检测与属性分析大多是在多阶段的算法框架中分开独立进行的,该多阶段方式有许多缺陷:1)目标检测误差会引起属性分析的累积误差;2)无法同时利用多个任务间的相关性信息;3)模型训练和测试流程复杂。本文提出了一种基于多任务深度学习的端到端的目标检测和属性分析算法,对其进行了改进。本文的主要贡献如下:1.本文在目标检测算法FasterR-CNN[1]基础上,提出了一种创新的端到端的目标检测与属性分析算法。该算法的优势如下:1)能够引入目标区域的上下文信息,从而减小目标检测误差带来的属性分析累积误差;2)利用多任务学习对目标检测和属性分析任务进行端到端的联合训练,充分利用相关任务的标注信息,提高模型的泛化能力;3)该算法只需要一个模型,简化了模型训练和测试流程,加快了计算效率。2.本文将端到端的目标检测与属性分析算法应用于手势交互任务。该算法能够准确地检测第一视角下的用户交互手势,同时准确识别手势类别并定位手势关键点。该算法在手势检测、手势识别和关键点定位三个任务上的准确性均高于多阶段算法,验证了本文所提出的端到端算法的优点。3.基于所提出的端到端的手势交互算法,本文构建了一个第一视角下的空中手写识别交互系统。该系统以手势类别为交互指令,利用关键点移动进行精细化的书写交互,并对空中手写轨迹进行手写识别,达到了良好的用户体验要求,验证了算法的实用价值。4.本文将端到端的目标检测与属性分析算法应用于车牌检测任务。该算法能够准确地检测车牌区域,并通过车牌的多方向属性分析得到多方向的车牌检测结果,为车牌识别算法奠定了基础。
其他文献
分析PubMed数据库中撤销的造假论文的特征及学术净化效果。发现近10年间撤销造假论文433篇,分布在25个国家,日本最多,美国次之,其次是德国、印度和中国。造假论文分布在178种
近年来(1980—1985),世界捕捞量和养殖产量有了明显增加,年产量达8,500万吨(不含藻类),其中约1.000万吨来自淡水渔业和淡水养殖,海洋的鱼类生产力超过了200公斤/公里^2,世界人均渔获
为了研究内蒙古地区不同来源乳酸菌对病原菌的体外抑菌作用,试验采用牛津杯法对从30日龄仔猪粪便、某养鸡场饲养的鸡肠道、阿拉善牧区的酸奶和酸驼乳中共分离到31株乳酸菌,初
本文对利用熔盐电解法从金属氧化物中直接电解制备钛镍合金的可行性进行了研究。在熔融CaCl2体系中,以二氧化钛和氧化镍的混合物为阴极,石墨为阳极,在电解温度900~1000℃,槽电压2.6V~3.1V条件下进行电解,采用SEM、EDS、XRD等方法对电解还原产物进行了分析。结果表明,二氧化钛和氧化镍被电解还原为钛镍合金,组成符合设计配比,并且合金成分均匀。
采用电弧熔炼(CA)和机械合金化(MA)通过热压烧结工艺制备了晶粒尺寸差别较大的Cu-40Ni合金,借助于PARM273A和M5210电化学综合测量仪,利用动电位扫描法和交流阻抗技术对比研究了上述
缺氧/好氧膜生物反应器(A/O-MBR)因增加前置反硝化区实现了一定的脱氮除磷效果,但其在运行过程中仍面临出水总氮不理想、膜污染等问题。因此,如何提高A/O-MBR系统的脱氮效果以及
<正> 在杭嘉湖蚕乡,有一则流佳甚广,影响甚大的描述养蚕生产过程中人际关系的幻想故事,一般称之为《龙蚕》。为了考察这个故事的形成和流变轨迹,我们查阅了古籍,迄今知道它的
目前,在各类电视节目中,文艺晚会凭借着自身的魅力在广大的收视群中占有着一席之地。一台电视晚会艺术质量的好坏,首先取决于摄像的技术与艺术,为了更好的做好电视晚会艺术再
跨境电子商务是通过网络电子交易平台,实现线上支付、交易以及线下物流配送的贸易活动,是重要的国际贸易方法,能够弥补传统贸易方式的不足,与当前全球化的电子商务发展,以及
化学修饰电极能够降低电化学反应的活化能,并且使反应具有一定的选择性。但是一般的化学修饰电极生物毒性强,对生物分子可造成不可逆的破坏,制备高效且生物无毒性的电极成为当前