【摘 要】
:
随着卷积神经网络的快速发展,面向真实场景的目标检测技术已得到了广泛研究。尽管当前基于深度学习的目标检测算法取得了显著效果,但是检测模型的有效训练通常需要大量有标签数据。相较于通用场景目标检测,密集场景与医学场景下的特定检测任务对数据的标注有更为严格的要求,因此标注的获取更为不易。为了利用无标签数据进行学习以减轻对有标签数据的依赖,本文探索了两种特定场景下基于半监督学习的目标检测算法。(1)针对密集
论文部分内容阅读
随着卷积神经网络的快速发展,面向真实场景的目标检测技术已得到了广泛研究。尽管当前基于深度学习的目标检测算法取得了显著效果,但是检测模型的有效训练通常需要大量有标签数据。相较于通用场景目标检测,密集场景与医学场景下的特定检测任务对数据的标注有更为严格的要求,因此标注的获取更为不易。为了利用无标签数据进行学习以减轻对有标签数据的依赖,本文探索了两种特定场景下基于半监督学习的目标检测算法。(1)针对密集场景下的半监督检测任务,本文提出了一种基于双重一致性损失的半监督密集场景检测算法。该算法在平均教师的半监督框架下,采用了Io U(Intersection over Union)感知的配对策略,并集成了Io U感知一致性损失与候选框一致性损失。Io U感知配对策略将根据Io U对学生网络与教师网络的预测结果进行匹配,从而得到多组预测框配对。Io U感知一致性损失通过最大化预测框配对的Io U,以促使学生网络与教师网络的预测结果趋于一致。候选框一致性损失通过促使学生网络与教师网络产生相似候选框,以解决区域候选网络无法利用无标签数据进行训练的问题。此外,本文构建了基于工业场景的密集检测数据集Rebar DSC,该数据集共包含2125张钢筋图像,平均每张图像约有165个标注框。(2)针对医疗场景下的半监督腰椎检测任务,本文提出了一种基于先验知识与多视角的半监督腰椎检测与诊断算法。该算法在伪标签的半监督策略下,利用了解剖学先验知识如腰椎构造规律和椎体与椎间盘相互关系等,以修正伪标签中存在的错检与漏检,从而提升伪标签质量。此外,由于椎间盘疾病的医学影像复杂,仅利用单一视角图像无法对疾病类别进行准确诊断,因此本文算法采用了基于多视角的椎间盘诊断网络,以学习多种视角下的无标签医疗影像数据,从而在检测结果的基础上实现对椎间盘疾病的准确分类。为了验证本文所提出的半监督检测算法的有效性,本文在相关公开数据集上进行了对比实验与消融实验。实验结果表明,本算法均可有效提升检测性能,并优于现有半监督检测算法。
其他文献
智慧城市和智慧交通概念的提出和发展,给城市的智能交通控制带来了更高的要求。提高城市交通运输枢纽的通行效率和智能化水平成为了推进智慧交通的重点之一。因此,交通信号灯配时优化问题(Traffic Signal Timing Optimization,TSTO)得到了越来越多研究人员的关注。传统的信号灯配时方案一般仅具备解决交通流冲突的能力,并不能找到最优方案以提高交叉路口的通行效率。随着城市的发展,过
平面叶栅试验器是研究压气机内部流动和叶型气动性能的基础设施,然而,现有试验器测得的试验数据会因试验器的流场品质缺陷存在较大差异,因此,有必要深入研究平面叶栅试验器流场品质改进措施,以及相应的流场品质评价方式。本文结合平面叶栅试验器的结构特点,利用数值模拟方法研究了不同措施对试验器流场品质的改善效果,并依据不同措施的流场表现探讨了平面叶栅试验应满足的流场品质要求。首先,试验器流场品质受附面层和上侧通
动作识别在人机交互、视频监控、医疗护理等领域有着广泛的应用前景。骨架序列是一种简洁的动作表示,是动作识别算法的重要数据形式。骨架动作识别任务的主要难点在于人体运动模式的复杂性导致较大的类内差异性。例如由于个人习惯的不同,不同的人执行同一动作存在着一定的差异,即使同一个人在不同时间或地点做同一种动作也不完全相同。另外,观察角度的变化可能对动作识别的准确性产生负面影响,且关节坐标估算也存在一定误差。为
随着时代的发展,产品生产正朝着品种多样,个性多变,更新换代加快的方向发展。传统的机器人示教方法在新的制造模式下难以满足要求。因此,高效、自然、适应性强的基于人体体势的示教技术成为研究的热点。本文提出一种基于人体三维体势的机器人自适应示教再现方法。为避免基于红外光测距的人体三维重建存在人体姿态局部深度空洞,导致空间位置示教错误问题,本文利用人体关键点在同一时刻两个相机中形成的视差,对人体姿态进行三维
人脸表情识别是计算机视觉的一个热点研究方向,该技术可以被广泛地应用于人机交互、疲劳驾驶检测、医疗、安防、教育等领域。随着深度学习的出现和发展,卷积神经网络已经更多地被应用于人脸表情识别领域。相比于传统特征提取方法,深度学习方法能够提取图像高层语义特征,获取有表达力的特征,从而达到更高的表情识别准确率。然而,目前已有卷积神经网络表情识别方法多有参数量大、计算成本高的问题。针对卷积神经网络的不足,本文
高速公路上的烟火、非机动车和抛洒物事件,极大地影响了行驶安全。目前高速公路监控中心的工作人员需人工值守监视器,人为发现交通事故和危险隐患,无法通过有效的监控手段对海量外场设备的运行情况进行实时地监控与跟踪。当前对高速公路异常事件的检测方法,在检测准确率和检测速度方面有所欠缺,离实际应用还有一定距离。本文针对高速公路实际情况,研究和实现了高速公路烟火、非机动车和抛洒物事件检测算法。本文的主要内容如下
持续安全是民航强国建设的三大核心之一。探索并总结中国民航保持长周期安全运行记录背后的成功经验,确定影响民航持续安全运行诸多因素中的关键成功因素,通过对关键少数因素的管控,不但能够促进行业持续安全运行,同时能够更加高效的配置资源,提升管理效率。首先,明晰了持续安全关键成功因素的内涵,基于扎根理论的三级编码过程对民航行业专家的调研访谈记录、近十年中国民航安全工作报告、民航企事业单位安全工作报告、民航的
可控飞行撞地事故是仅次于飞行失控事故的第二大致命事故类型,常常造成机毁人亡的严重后果。因此,被国际民航组织认为是导致商用飞机机体坠毁及人员伤亡事故的“头号杀手”。当前常用的单一事故分析模型难以全面识别事故致因,因此需要利用系统分析模型,并辅以人为因素模型进行补充,识别出导致可控飞行撞地事故发生的危险源及其关键风险,同时对关键风险提出相应的干预措施进行风险管控。首先,构建了基于系统理论的致因分析方法
广域信息管理系统(System Wide Information Management,SWIM)是下一代空中交通管理(Air Traffic Management,ATM,简称:空管)系统的基础信息网络,负责海量多源异构空中交通管理业务数据的传输和共享。其中,SWIM基础设施层采用全新互联网架构—信息中心网络(Information-Centric Networking,ICN),根据命名数据网