【摘 要】
:
深度学习(Deep Learning)在提高人工智能水平方面起着巨大的作用,其中卷积神经网络(Convolutional Neural Network,CNN)凭借其“稀疏连接”与“参数共享”的特性,具有较好的自学习能力和鲁棒性,因而被广泛应用于如图像分类、目标检测等领域。作为一种数据驱动的端到端特征提取技术,在各类数据样本急剧增大的同时,卷积神经网络的模型结构也愈发庞大且复杂。与此同时,这种从数
【基金项目】
:
国家重点研发计划项目(编号2020YFC1522900)
论文部分内容阅读
深度学习(Deep Learning)在提高人工智能水平方面起着巨大的作用,其中卷积神经网络(Convolutional Neural Network,CNN)凭借其“稀疏连接”与“参数共享”的特性,具有较好的自学习能力和鲁棒性,因而被广泛应用于如图像分类、目标检测等领域。作为一种数据驱动的端到端特征提取技术,在各类数据样本急剧增大的同时,卷积神经网络的模型结构也愈发庞大且复杂。与此同时,这种从数据中学习特征的形式也存在一定的“黑盒”特性,即人们难以理解模型内部的预测逻辑,缺乏一定的可解释性。因此,对卷积神经网络模型的可视化分析、模型结构的优化以及与可解释性模块的结合研究,都是在一定程度上帮助人类理解其内部逻辑,同时这些方法也对卷积神经网络模型的收敛速度、模型复杂度以及识别精度等都有重要影响。本文在探讨可解释性模块与传统卷积神经网络相结合方式的基础上,提出了基于二维小波变换的卷积核代替传统卷积神经网络第一层卷积核的方法,并在图像分类场景下验证了该方法对卷积神经网络所带来的影响,具体的研究内容以及创新点如下:1、本文基于小波变换理论,对二维连续小波进行离散采样,将传统卷积神经网络的第一层卷积层替换成本文所设计小波卷积模块(Wavelet Convolutional Module,WCM),用该小波卷积模块对输入图像进行特征提取,并针对小波卷积模块中的伸缩因子和平移因子引入一种选择性参数初始化方法,手动对伸缩和平移因子进行参数设定。在此基础上,设计搭建了2D-WCNN(Two-Dimension Wavelet Convolutional Neural Network)模型,在图像分类场景下,用Dog-vs-Cat数据集和PASCAL-VOC数据集验证了2D-WCNN模型的性能,具体对比了不同的母小波函数(Mother Wavelet)以及小波卷积模块中卷积核尺寸的影响。实验结果表明,本文所设计的2D-WCNN模型相比传统卷积神经网络有着更优的性能,在Dog-vs-Cat数据集上准确率最高提升了4.9%,在PASCAL-VOC数据集上准确率最高提升了7.05%。2、进一步的,为了弥补小波卷积模块中伸缩和平移因子手动设定且不可训练所存在的缺陷,优化模型训练所需的时间开销,基于卷积神经网络的反向传播(Backpropagation)算法,提出了自适应小波卷积模块(Adaptive Wavelet Convolutional Module,AWCM),使伸缩因子和平移因子同时受网络模型反向传播的迭代而更新。在此基础上,将改进的自适应小波卷积模块替换传统卷积神经网络的第一层卷积层,且减少了其卷积核维数(即通道数),设计搭建了2D-AWCNN(Two-Dimension Adaptive Wavelet Convolutional Neural Network)模型,在图像分类场景下验证了2D-AWCNN模型提取图像特征的良好性能。实验结果表明,相比传统卷积神经网络模型,2D-AWCNN模型在Dog-vs-Cat数据集上准确率最高提升了5.76%,在PASCAL-VOC数据集上准确率最高提升了9.01%。本文基于可解释性模块原理,提出的二维小波变换与卷积神经网络相结合的方式在图像分类场景下得到了验证,可解释性模块的设计在一定程度上为卷积神经网络提供明确的语义的同时,实验结果也证明能有效地提高模型的性能,本文设计的基于二维小波变换的卷积神经网络模型在Dog-vs-Cat数据集和PASCAL-VOC数据集上均取得了良好的效果,有着更快的收敛速度和更高的识别准确率。
其他文献
住宅建筑空调能耗逐年攀升,迫使降低住宅建筑空调能耗成为建筑节能工作的重点。降低空调能耗的前提是需要充分了解空调能耗的特征,然而由于经济条件、气候条件、建筑形式、设备形式等的差异导致住宅建筑空调能耗在不同地区之间存在差异。因此,探究不同设备形式能耗影响因素,量化空调能耗的特征对于指导住宅节能是一项非常有意义的研究。本文首先从室外气象条件、室内用能行为、供暖空调设备以及围护结构出发,综述了国内外关于空
智能汽车的交通信号灯识别系统是其环境感知功能的重要组成部分。目前对信号灯识别方法的研究面临三大挑战:(1)场景内容复杂,环境条件多变导致信号灯识别准确性和鲁棒性降低;(2)信号灯识别缺乏语义信息,无法为车辆下一步控制提供信息;(3)识别准确性和实时性难以同时兼顾,无法适应实际工程需求。为了解决上述问题,本文提出了一种基于深度学习检测、聚合特征通道跟踪和车道级高精度定位的交通信号灯识别系统;搭建了基
随着汽车电子技术的发展和人们对交通安全的重视,各种车辆主动安全系统逐渐兴起,它们能让车辆适应各种行驶状态和道路环境以提高车辆的主动安全性能。现有的车辆主动安全系统主要针对车轮制动防抱死、驱动防滑转、横摆稳定性和侧倾稳定性中的某一项进行单独控制,或者其中两项进行简单的集成控制,不能同时满足各项主动安全性能需求。比如在转弯制动工况下,质心较高、轮距较窄的车辆将会同时面临车轮抱死、侧滑和侧翻的风险。为了
农业农村向高质量发展是我国当前乡村振兴的重要目标。我国作为陆地面积2/3均为山地的大国,近郊山村耕地不断受到侵蚀;远郊山村因复杂的立地条件,农业规模化、机械化、现代化发展困难或受城乡二元对立山区耕地撂荒和山村空心化现象严重,造成了山地乡村产业经济发展落后于平原地区,客观上这也是中国14个连片特困地区都是山地的原因,故探索山地乡村可持续发展转型途径尤显紧迫。论文立足于农业公园作为山地乡村高质量转型创
近年来,随着互联网行业的高速发展和开源软件、开源社区的兴起,网络上出现了大量的代码仓库,特别是一些被高频访问的在线搜索网站,例如Github等,其中包含了大量供开发人员复用的代码和项目资源。当开发人员需要完成一个编程任务却不知道该调用哪些函数时,代码搜索与复用就成为了解决上述问题和提高软件开发效率的捷径。如何有效帮助开发人员从候选的代码库中搜索与指定编程任务相关的代码,已成为软件工程重要的研究领域
随着改革开放的不断深入,中国多种产业遍地开花繁荣发展,社会的劳动力也呈现出了“白领化”的趋势。有专业预测,到2030年我国中等收入群体将达到6亿,有望在2050年达到9亿。中等收入群体的壮大无疑为城市化和社会经济增长带来巨大的动力,但也对城市空间和居住环境提出新的要求。为了迎合他们的房需求,城市进行一系列大尺度的再开发和旧城改造,重构了中国城市的内部空间。这也引发了城市旧城社区人文内涵被破坏、居住
噪声源定位是控制车辆噪声及提升NVH性能的先决条件,近场声全息是一种通过传声器测量信号实现噪声源可视化的高效技术,广泛应用于汽车与故障诊断等领域。基于等效源法的近场声全息因为易于实现且适用于识别复杂表面形状声源成为了研究的热点,其核心难点为等效源强度求解。此外,在工程实际中的目标声源附近往往存在干扰源或反射表面,为实现对目标声源的准确识别,需要通过声场分离技术分离目标声源与干扰源的声场。据此,本文
近年来,药品及个人护理用品(PPCPs)受到全世界范围的普遍关注,抗生素作为一类典型的PPCPs,具有高效、广谱和价廉的特点,是人与动物疾病预防和治疗的常用药物,也被广泛用于饲料添加以促进动物生长,在国内环境中广泛检出,对生态环境和人体健康具有潜在负面影响。然而,关于农村和偏远地区环境中抗生素的研究较少。本研究选择了寒冷地区的6个村镇和5个养殖场地,以喹诺酮类(QNs)、磺胺类(SAs)、四环素类
癌症即恶性肿瘤,是最致命的疾病之一,其发病率和死亡率呈迅速上升的趋势,严重威胁着人类的健康。传统的治疗方法,如化疗、放疗和手术等,其疗效不能完全达到令人满意的效果。其中化疗是治疗肿瘤的主要策略之一,但是一些具有较高活性的抗肿瘤药物是疏水的,且没有特异性,容易对正常组织和细胞产生毒害作用。鬼臼毒素(Podophyllotoxin,PPT)由鬼臼属植物的根和茎提取而得,是一种具有显著抗肿瘤和抗病毒活性
岩溶地面塌陷是可溶岩分布地区在各种因素作用下,地表发生突然塌陷的过程。作为最危险的自然灾害之一,岩溶地面塌陷已成为岩溶地区最普遍的地质灾害,其危害主要表现在破坏公路、铁路、建筑物以及地表水体,影响农业用水、用地,造成人员伤亡及财产损失等。岩溶地面塌陷由于其隐蔽性、突发性、不确定性、多因素性和危害性等特点,已成为影响和制约岩溶地区社会与经济发展的重要因素。目前,学者们采用多种方式对岩溶地面塌陷的孕育