【摘 要】
:
航拍图像中的目标检测是计算机视觉相关研究中的一个热点领域,虽然已有诸多的研究成果,但只有较少的工作对深度学习目标检测模型应用于航拍目标检测任务上存在的问题进行了分析。通过对比自然图像和航拍图像两类图像的特征可知,目前航拍图像目标检测模型精度提升的瓶颈是航拍图像的目标特征存在显著不一致性导致的,图像中检测目标尺寸具有极大的差异性且部分目标绝对和相对像素面积均过小,这些问题导致了现有的检测模型的准确率
论文部分内容阅读
航拍图像中的目标检测是计算机视觉相关研究中的一个热点领域,虽然已有诸多的研究成果,但只有较少的工作对深度学习目标检测模型应用于航拍目标检测任务上存在的问题进行了分析。通过对比自然图像和航拍图像两类图像的特征可知,目前航拍图像目标检测模型精度提升的瓶颈是航拍图像的目标特征存在显著不一致性导致的,图像中检测目标尺寸具有极大的差异性且部分目标绝对和相对像素面积均过小,这些问题导致了现有的检测模型的准确率和召回率等几项指标均相对较低,深度学习模型在航拍目标检测任务中的性能表现与自然图像的目标检测任务相比更低。研究从课题组项目中遇到的航拍目标检测性能缺陷出发,根据航拍图像数据存在的轮廓特征重要而纹理特征相对模糊的特点,通过改进现有网络结构来减轻上述问题对航拍场景下目标检测模型造成的影响。基于傅里叶变换对图像高频和低频信息分离的良好特性,提出了使用离散余弦变换模块作为深度学习模型中的插件结构的方法,在不改变模型端到端特性的情况下,将网络结构中用于提取低级语义信息的浅层卷积模块进行替换,通过这种方式将航拍图像在频域中编码成一种更利于神经网络学习轮廓特征的形式,在一定程度上降低了网络的深度,从而限制其感受野范围。测试并分析了目前卷积神经网络模型在目标轮廓特征提取上存在的缺陷,为了应对这一缺陷,在中央处理器和图形处理器两种计算单元上分别实现并逐步优化了离散余弦变换模块,模块的计算速度提升了4倍左右。在YOLOv5、Efficient Det和Retina Net等3个常用的前沿网络结构上测试了加入该插件结构后的改进网络的检测性能,并与原模型在基准数据集上进行对比和分析,实验证明改进网络模型的平均准确度分别提升了0.3%、2.7%和1.6%,精确率分别提高了7.0%,10.2%和7.2%,召回率下降了4.1%、3.9%和5.6%,改进网络对噪声以及一些特征不明确的难例目标敏感度下降,该结构提升了神经网络对部分轮廓相对固定的小目标的检测效果。
其他文献
目的 分析动脉穿刺置管后新型固定方式在成人ICU患者的应用效果。方法 采用目的抽样法选取2019年2月至2020年8月河北沧州中西医结合医院ICU收治的120例行动脉穿刺置管患者作为研究对象,按照随机数字表法分为对照组和试验组,每组60例。对照组给予常规治疗,试验组应用2 cm×2 cm 3M胶布改良固定方式。比较两组患者压力换能器与置管接头处下方皮肤损伤、疼痛情况、导管移位及护士满意度。结果 试
<正>膝关节骨关节炎作为中老年人的常见病和多发病,目前已成为致残的主要病因之一[1]。膝关节置换术是治疗骨关节炎、恢复膝关节功能最有效的手段之一。膝关节置换术分为全膝关节置换术(totalkneearthro plasty,TKA)和单髁置换术(unicom partmentalkneearthro plasty,UKA),由于TKA缓解疼痛和功能恢复方面具有可预测性、持久性和有效性[2],长期以
大数据时代的来临丰富了科技信息文本的产生方式和获取渠道,科技信息文本数量呈指数性增长,文本自动摘要技术利用计算机将科技信息文本压缩成简短摘要,科技研究人员通过阅读摘要大大提升了获取科技信息的效率。传统的抽取式摘要方法存在提取文本语义特征有限、摘要与源文本主题偏离、输出结果的阈值难以确定等问题,导致生成的摘要质量不高。针对这些问题,将抽取式摘要生成分解成文本摘要候选集生成和全局文本摘要选择两个阶段进
目的 观察内侧单髁置换联合自体骨软骨移植治疗膝关节双间室骨关节炎的中短期临床疗效。方法 回顾性分析2018年6月至2019年9月在中国中医科学院望京医院关节一科采用膝关节单髁置换术(unicompartmental knee arthroplasty, UKA)联合自体骨软骨移植技术治疗膝关节双间室骨关节炎患者22例,其中男性6例,女性16例;年龄58(53,64)岁。收集手术前后影像学资料,记录
随着单髁置换术在临床的应用逐渐增多,其并发症也逐渐得到临床工作者的重视,希望通过技术的革新以及科技的进步,来进一步降低手术并发症,提高患者满意度,本文对单髁置换手术常见并发症做文献综述,来阐述目前学术界对于该问题的认识。
代码补全技术是程序自动生成技术的重要分支,它根据已有的部分代码来自动补全某一位置的代码,从而提高代码编写和维护的效率与质量。此外,广义的代码补全还包括代码还原、代码修复等。随着神经网络的快速发展以及开源代码语料库的逐步丰富,使用神经网络模型对大规模源代码进行建模与学习并进一步解决代码补全问题,是代码补全领域的重要研究方向与趋势。为了解决现有的代码补全方案在通用性、补全准确率和灵活性上的不足,提出了
卒中是我国成人致死、致残的首位病因,给患者及社会发展带来了沉重负担。组织化管理方法能够一定程度上提升卒中医疗质量,但医疗机构后勤服务支撑能力的异质性为卒中组织化管理的效果带来不确定影响。为进一步完善卒中组织化管理模式,提升卒中治疗的科学性及系统性,本指南就院前急救系统及卒中急诊的组织化管理、急诊多学科协作团队的管理、绿色通道的持续质量改进、卒中单元及卒中门诊的组织化管理、卒中中心的区域协同网络建设
<正>我科在1993~1994年收治患儿中,选择3岁以内患支气管肺炎的患儿134例,对这些患儿进行分组护理,一组按肺炎护理常规进行护理,另一组加以胸背部按摩和拍打以辅助治疗,取得
随着视频大数据的日益积聚、硬件技术的不断突破和计算机视觉技术的迅猛发展,基于视频监控图像和深度学习的行人重识别技术在城市安防和智慧社区等领域中持续发力,应用前景广阔。然而,现实复杂场景下的行人重识别面临着非常严重的域偏差问题,光照、视角、分辨率等外部因素的差异都将对算法的精度产生严重干扰。因此研究行人重识别的域自适应问题对面向实际应用的算法落地有着极为重要的意义。基于对抗生成网络和聚类伪标签两种方
新冠肺炎自2019年末爆发以来,全球每日新增确诊病例已达到数十万例。计算机断层扫描(CT)检查是一种高效敏感的新冠肺炎筛查手段,分割CT图像的新冠病灶是诊断新冠肺炎及监测临床病情的重要步骤。但由于缺乏经验丰富的放射科医师,对CT图像的分割很难大规模进行,急需探索高效的新冠肺炎病灶自动分割方法。常规的卷积神经网络分割模型参数较多,其泛化能力受限于训练样本数量。而常用于医学图像分割的UNet模型在应用