基于优化胶囊网络的图像识别算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jiaomoji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能已经越发地贴近人们的日常生活之中,自动识别车牌,通过面部识别来进行支付操作,都已经融入到了社会的各行各业之中。而这些识别系统的核心算法大部分都是来自于卷积神经网络(CNN)。虽然卷积神经网络在图像识别领域已经是非常成熟且应用良好的一个算法,但卷积神经网络依旧存在着一些问题,诸如卷积神经网络的不可解释性,在学习过程过分强调不变性特征的学习,都是卷积神经网络无法规避的问题。胶囊网络在网络结构上针对这些问题有了一定的改进,本文对卷积神经网络、胶囊网络进行了优化,使用堆叠胶囊自编码器在多个数据集上与卷积神经网络、胶囊网络做了对比实验,通过实验结果与分析,表明本文提出的对卷积神经网络与胶囊网络的优化方法是有效的。本文的主要工作包括:(1)详细分析了卷积神经网络在国内外的研究与应用现状,对基于卷积神经网络的图像识别算法进行了剖析,针对其存在的问题,提出了本文的研究思路以及研究内容。(2)详细分析了胶囊网络自2017年出现到2020年的发展历程,即胶囊网络、带EM路由的胶囊网络、堆叠胶囊自编码器以及类条件胶囊的重构。并采用胶囊网络以及经过优化后的胶囊网络来完成本文的实验内容。(3)设计了一个卷积神经网络和胶囊网络在MNIST数据集上的对比实验。首先在训练集是1对1识别,测试集也是1对1识别的情况下进行对比实验。实验结果表明,在这种情况之下卷积神经网络和胶囊网络的表现是相近的。然后在训练集是1对1识别,测试集是2对2识别的情况下进行对比实验。(4)基于前文的实验内容,对胶囊网络的结构进行了优化,并在MNIST数据集上再次实验,发现优化后的胶囊网络训练效率更高、识别准确率也有了一定的提升。并且在之后使用了混合批次训练的方式来训练胶囊网络,得到了更好的识别准确率。(5)将优化后的胶囊网络分别在CIFAR-10、CIFAR-100、SVHN数据集上进行了实验,发现优化后的胶囊网络的识别准确率能够略高于目前其他神经网络算法在这些数据集上识别准确率的平均水平。
其他文献
功率放大器是无线通信系统中的重要组成部分。由于功放固有的非线性特性,信号会产生非线性失真,引起信号带内失真和带外频谱扩展,导致信号的误码率增加,因此需要使用线性化技术来改善功放所产生的非线性影响。在现有的功放线性化技术中,预失真技术以其精度高、性能稳定和易于实现等优点得到了广泛的应用。本文基于人工智能领域中的神经网络(Neural Network,NN)理论和支持向量机(Support Vecto
放电等离子体中形成大量初级活性物种,通过扩散进入水中,与水发生反应形成次级物种,包括H2O2、NO3-、NO2-等,即形成等离子体活化水(Plasma activated water,PAW)。目前国内外研究人员将PAW应用到灭菌领域中,提出了多种机理对其进行解释,他们大多都认为与PAW中的活性氮氧化物和其所涉及的复杂化学反应密切相关,其中不乏对HNO2和H2O2反应产物ONOOH的猜测,然而关于
近年来,随着云计算、人工智能、5G技术的快速发展,产生的数据量每时每刻都在剧烈地增加,对存储和计算都造成了很大的压力。新兴非易失性存储器NVM是下一代高速持久化存储的主流解决方案之一,它有接近内存的访问速度、数据掉电不丢失、可按字节寻址和低功耗等良好的特性。所以,有大量研究将非易失性内存作为文件系统的底层存储来使用,进而诞生了很多针对于非易失性内存而设计的文件系统,这些文件系统充分地利用了非易失性
地图构建是移动机器人领域的重点研究方向,是移动机器人实现自主导航的前提。地图构建的核心技术是同时定位与建图(Simultaneous Localization and Mapping,SLAM)。SLAM是指机器人本体在未知环境中运动时,估计自身运动,同时构建环境的地图。移动机器人在室外的地图构建方法选择和应用是其设计的难点之一。SLAM按其传感器类型可以分为基于激光雷达的SLAM方法和基于相机的
随着互联网的飞速发展,网络社区用户对数据交换的需求急剧增长,网络数据共享的方式也逐渐多样化。基于FTP和HTTP协议的中心化文件下载服务器为社区用户提供了高密度的信息,但是独立服务器的运营成本高,且社区运营者的个人决策行为会给社区共享网络带来不确定的风险。商业网盘凭借其跨平台、高质量的文件管理方式,为数据共享提供了额外的可选项,但是通过网盘共享的资源较为分散,导致信息密度低,增加了用户的筛选成本。
近些年来,无线通信技术成为人们生活中不可或缺的一部分。随着无线通信技术的发展,通信业务方面的需求也在提高,带宽宽、结构简单、功耗低以及通用化是射频前端技术发展的必然趋势。为满足通信业务的相关需求,选择合适的变频结构也是至关重要的。频谱搬移是无线通信技术的核心之一,对传统的超外差变频结构而言,其需多次的频谱搬移才能满足需求,势必导致成本、空间以及功耗的增加。在零中频变频结构中只需一次频谱搬移就可以实
时变问题在科学与工程领域受到广泛关注,如信号处理、机器人控制、人脸识别、在线计算等.本文主要探讨求解时变非线性方程组的两层迭代法,具体工作如下.首先关注时变非线性方程组的求解精度问题,借助经典Newton法的思想推导出一个适用于时变非线性方程组的时变Newton法,并通过引入两层迭代思想,将经典的Newton法作为内迭代控制时变非线性方程组的求解精度,构造出两层Newton迭代算法.理论分析表明该
一般三次覆盖的分歧曲线次数为偶数且仅以尖点作为奇异点.用3可除集的概念可以对曲线与曲面的尖点进行研究,利用3可除集的概念也可以对某类一般三次覆盖进行分类.本文介绍了 3可除集的定义与有关性质,说明了 3可除集与三次循环覆盖之间的关系.推广了3可除集,提出并定义了5可除集的概念来研究曲面上A4型奇点.通过推广3-挠群与F3上的三元编码等概念,得到了 5-挠群与F5上的三元编码.构造了一个与5可除集对
本文研究了R2中有界正则区域Ω上的Emden-Fowler型方程(?)其中λ>0,A(x)=(aij(x))是一个二阶正定对称矩阵.aij(x)(i,j=1,2),b(x)是Ω上的光滑函数,并且满足条件(H):0<α≤aij(x),b(x)≤β<∞,i,j=1,2.我们考虑该方程的解的渐近行为,并且证明了方程的非极小解uλ在a(x)=(?)的临界点处爆破,同时我们还证明了,?p ∈(1,2),在W
截至2019年,我国常住人口城镇化率已经突破了60%,这一数字是全社会方方面面长足进步的一个缩影。然而这一过程中也产生了很多矛盾:如资源消耗和产出的不匹配、人口和土地城镇化的不协调、区域间信息的不对称等。因此,在研究城镇化问题时,除了关注城镇化率的增长外,还应重视效率问题以及效率的影响因素。随着区域间联系的日益紧密,为城镇化问题的研究带来了新的视角;空间分析工具的不断发展,为各区域间的异质性问题带