深度神经网络模型超参数进化调优及其应用研究

来源 :南宁师范大学 | 被引量 : 2次 | 上传用户:qnmdmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据物联网与云计算的兴起,数据支撑决定着各行各业的发展。解决问题的上限是由数据决定的,而如何处理数据成为科研人员和工程人员值得关注的方向。人工智能正逐渐从高端技术走向通用技术,其原因是有了云量的数据、强大的计算资源和处理数据的机器学习算法。深度学习是当下最流行的机器学习算法,它可以快速、高效的从海量数据中获取有用信息加以利用。在使用深度学习算法之前,如何对算法的超参数配置是取得较好效果的关键,在同一问题上不同超参数配置的模型效果差异较大。超参数就是在算法运行之前需设定好的参数,如卷积神经网络中的激活函数就是其中一个超参数。在大型机器学习算法尚未兴起之时,超参数的设定大多是由经验丰富的专家手动设计。近年来,随着数据呈指数级增长,深度学习算法中的超参数从十几个到几百个不等,手工设计方法已然不能满足需求。基于此,本文提出基于模糊控制多细胞基因表达式编程算法的超参数优化方法。本文主要工作如下:(1)提出了基于模糊控制多细胞基因表达式编程算法(Fuzzy control multi-cell gene expression programming algorithm,FMCGEP)的超参数优化方法。多细胞基因表达式编程算法是进化算法中的一种,由遗传算法(Genetic algorithm,GA)与遗传编程(Genetic programming,GP)相结合得来,该算法编码与解码简单灵活,表达能力强,解决复杂问题效率高,但其易于陷入局部最优问题,为此引入模糊智能控制技术,增强跳出局部最优的能力,从而更准确找到全局最优解。(2)将FMCGEP算法实现对DNN模型的超参数优化,该算法简称为FMCGEP-DNN。准确的降水预报是一个非常困难的问题,因为降水具有高度的不确定性和变异性。近年来,人工智能领域最受关注的机器学习方法当属深度学习,它已经成功地应用于包括降雨预测在内的诸多领域。然而,在构建高性能的DNN模型时,神经网络中超参数设计和调整仍然需要专业知识,因此提出了一种基于改进基因表达编程的DNN模型超参数自动优化设计方法,该方法可以自动优化DNN中超参数,并将该模型用于降水建模和预报。通过三个真实降水数据集的实验,验证了该算法在MAE、MSE、RMSE和R-Squared四个评价指标上的性能。实验与基线机器学习方法、超参数优化库方法和基于遗传算法的超参优化方法对比,结果表明本方法的有效性。(3)将FMCGEP算法实现对CNN模型的超参数优化,该算法简称为FMCGEP-CNN。卷积神经网络(Convolutional neural networks,CNN)技术在图像分类任务中取得了当前最佳效果,然而,为了设计出具有高性能的卷积神经网络,需要在CNN和应用问题领域拥有广泛的专业知识和实践经验进行较优的CNN设计变量设置,这使得不一定每个对CNN感兴趣的用户都适用。针对此问题,本文提出了利用模糊控制多细胞基因表达式编程算法来自动优化CNN中超参数的方法。该方法设计了一种有效的可变长度基因编码策略来表示CNN的超参数,从而描述不同的构建块和不可预测的最优深度,并将该算法应用于MNIST、CIFAR10和大肠癌症医学图像三个数据集进行验证。与其他已有先进算法进行试验比较,结果表明本文算法在分类准确度中可获得更好的效果,算法鲁棒性更强,且整个过程全自动完成。(4)提出一种新的编码方案。在使用FMCGEP优化DNN/CNN过程时,需要将DNN/CNN中待优化的超参数编码到染色体中,为了使算法能描述不定个数超参数,设计了一种新的超参数编排顺序的方法。(5)提出了新的适应度评价方案。在优化DNN超参数时,将模型的训练数据与测试数据之间的误差作为算法的适应度值;在优化CNN超参数时,将模型预测准确率最为算法的适应度值。
其他文献
石英器件在5G通讯、航天望远镜和医疗器械的光学系统中占据重要地位。胶粘剂在光学系统中有着广泛的应用,是石英器件的组装、固定和密封的关键材料,可逆胶粘剂在石英器件拆卸
城市土地分布信息的获取一直是遥感技术应用研究的一个重要方向,在获取城市土地信息时,可以使用语义分割作为解析图像场景的方法,通过对图像中每个像素标注其对应的语义标签,在完成图像的像素级分类的同时也对目标进行了分割。由于卫星遥感图像的获取时间周期长,容易受到自然环境的影响,而无人机是低空拍摄,具有机动性强、获取图像分辨率高、成本低等优点,因此本文使用无人机获取遥感图像,对基于深度卷积网络的无人机地物场
纳米粒子与生物膜作用过程的分子动力学研究是近些年研究的热点,尤其是跨膜多肽作为药物载体在微观尺度下的仿真研究,为其在医疗领域(药物输运)中的应用提供了重要的参考。本研究运用粗粒化分子动力学(coarse-grained molecular dynamics,CGMD)方法模拟并深入分析了多聚精氨酸多肽(R8)与生物膜的作用过程,探究内容包含两部分:(1)R8与带曲率膜和平面膜的相互作用,主要研究电
液滴碰撞固体表面广泛存在于日常生活和工程领域中,尤其是液滴撞击超疏水表面,其动力学特性在自清洁、流体减阻和抗结冰等领域具有重要的应用前景。目前对于液滴撞击超疏水表
如今机器学习成为了一种从原始数据中提取结构化信息和知识的基础手段。在机器学习的研究和应用方面存在着两种趋势:更大规模的训练数据和更加复杂的模型,单台商用计算机的计算能力和存储能力无法承受训练如此大的模型所带来的计算任务,这种挑战促进了对分布式机器学习的研究。对机器学习模型进行训练需要求解一个优化问题,交替方向乘子法(Alternating Direction Method of Multiplie
火烧油层是一种具有重要意义的热力采油技术,能大幅度地提高采出程度,具有很高的研究前景。在火驱开发中,油墙作为储集层中最重要的区带,对火驱的高效开发具有重要意义,其能
本文主要研究如下形式的预定曲率方程解的曲率估计:σ_k(κ(X)+b(X))=ψ(X,υ),X∈M.(0.1)其中M?Rn+1是n维闭超曲面,X、υ分别表示曲面M上的点和该点的单位外法向量,σ_k为k阶初等对称函数,κ(X)为曲面M在X点处的主曲率,b(X)是给定的光滑对称二阶张量,ψ(X,υ)>0为给定的光滑函数。本文主要讨论预定曲率方程(0.1)的曲率估计,对于一般的ψ1/k(X,υ)&
本文研究了具依赖于时间阻尼的非等熵p-方程组柯西问题解的存在性和大时间渐近行为.具依赖于时间阻尼的非等熵p-方程组描述了可压流体的运动模型,具有丰富的物理意义.系统中
挥发性有机物(VOCs)不仅对人体健康有害,而且对环境也不利,被认为是主要的大气污染物之一。催化氧化技术是目前控制VOCs排放最有前景的方法之一,该技术关键在于研发高效的催化
农业科技推广服务目前已成为农业科技成果转化的必要环节,其中推广的质量问题正在引起社会各界广泛关注。为了实际了解辽阳市农业科技推广现状,为了从根本上发现其存在的问题