基于深度学习的自编码网络介绍及应用

来源 :锦绣·下旬刊 | 被引量 : 0次 | 上传用户:lishibo13514244774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文先介绍监督学习和无监督学习的概念,然后分析自编码器的特点和结构,并设计自编码网络的结构,最后通过MNIST数据集对自编码网络进行训练和结果分析。运行结果表明,自编码器是深度学习中的一种非常重要的无监督学习方法,能够从大量无标签的数据中自动学习,得到蕴含在数据中的有效特征
  关键词:自编码;深度学习;无监督学习
  中图分类号:TP183:文献标识码:A
  0 引言
  深度学习领域主要有两种训练模式:一种是监督学习,即不仅有样本,还有对应的标签;另一种是非监督学习,即只有样本没有标签。对于监督学习的训练任务来说,为已有样本准备对应的标签是一项很繁重的工作,因此,非监督学习就显得简单的多,因为如果能让网络直接使用样本进行训练而不需要再准备标签,是更高效的事情。
  本文接下来介绍的自编码器是深度学习中的一种非常重要的无监督学习方法,能够从大量无标签的数据中自动学习,得到蕴含在数据中的有效特征[1]
  1自编码器的特点
  人平时看一幅图像,并不是象电脑那样去逐个去扫描,一般是看一眼就大致能得到所需要的信息,比如图像的大小,形状、色彩和特征等。自编码器也有类似这样的功能,它是非监督学习领域的一种,可以自动地从无标注的原始数据中学习到特征,是一种以重构输入信号为目标的神经网络,它可以得出比原始数据更好的特征描述,具有较强的特征学习能力,通常在深度学习中常用自编码网络生成的特征来取代原始数据,以得到更好的特征提取效果。
  2 自编码器的结构
  自编码器(Auto-Encoder,AE)网络是输入等于输出的一种深度学习无监督学习网络,最基本的模型可以是三层的神经网络,即输入层、隐藏层和输出层。其中,输入层的样本在训练中会充当输出层的标签角色。也就是说,自编码网络是一种尽可能复现输入信号的神经网络。具体的网络结构图如图1所示。
  上图中,从输入到中间状态的过程叫做编码,从中间状态再回到输出的过程叫做解码。训练后的自编码器可以在隐藏层得到代表输入数据的特征,类似于PCA算法(主成分分析),即找到可以代表原信息的主要成分。
  自编码器要求输出尽可能等于输入,并且其隐藏层必须满足一定的稀疏性,这是通过将隐藏层中的神经元个数比前一层神经元个数少的方式来实现其稀疏效果的。相当于隐藏层对输入进行了压缩,并在输出层中进行解压缩。尽管整个过程中会有信息的丢失,但通过对模型的优化能使丢失的信息尽可能减少,从而最大化地保留其主要特征。其实自编码器和PCA比较类似,如果激活函数不使用Sigmoid,而是使用线性函数,那么就成了PCA模型。
  从以上分析得出,自编码器是一种无监督的学习算法,主要用于数据的降维或者特征的抽取,
  3 自编码器的设计思想及代码实现
  本节我们将通过一个提取图片特征并利用提取的特征还原图片的实例来说明自编码器的应用及代码实现效果。
  3.1 设计思想
  自编码器可以看作是对输入数据的压缩编码,将高维的原始数据用低维的向量表示,使压缩后的低维向量能保留输入数据的典型特征,从而能够较为方便地恢复原始数据[2]。这里需要注意的是,在对数据进行编码和解码时,使用的是同一个参数矩阵W。衡量W的训练效果方法是,编码后的数据能够较为容易地通过解码恢复成原始数据,我们则认为W较好的保留了数据信息。
  3.2 MNIST数据集介绍
  本文采用MNIST数据集是一个手写数字的数据库,它有60000个28*28像素的训练样本集和10000个28*28像素的测试样本集。样本中包含了各个训练数据和相应的标签,其中标签集包含了0,1,2,3,4,5,6,7,8,9一共10个分类数据[3]
  3.3 创建自编码网络
  下面通过构建一个六层的自编码网络,将MNIST数据集中的数字特征进行提取,再通过自编码器把这些特征重建MNIST数据集。
  (1)加载MNIST数据集,提取所有数据,把数据分为训练和测试两个数据集,分别是50000和10000条,不设定训练集和测试集标签。
  (2)定义自编码网络结构
  本文采用一个六层的深度学习自编码网络,先把28*28的原始数据转换展平成784的一维数据作为输入数据,通过第二层降维到256,然后再降到128,最后再以同样的方式经过128,再经过256,最后还原成784的图片并输出结果进行对比。网络结构变化如表1所示。
  (3)训练网络
  设置训练的参数,epochs=20,batch_size=256,learnning_rate=0.01。然后定义编码和解码函数,损失函数采用均方差,优化器采用RMSP。编码和解码的部分核心代码如下:
  # 编码
  def encoder(x):
  layer_1=tf.nn.sigmoid(tf.add(tf.matmul(x,weights['encoder_h1']),
  biases['encoder_b1']))
  layer_2=tf.nn.sigmoid(tf.add(tf.matmul(layer_1,
  weights['encoder_h2']),biases['encoder_b2']))
  return layer_2
  # 解碼
  def decoder(x):
  layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(x, weights['decoder_h1']),biases['decoder_b1']))   layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1,
  weights['decoder_h2']),biases['decoder_b2']))
  return layer_2
  #输出的节点
  encoder_out = encoder(x)
  pred = decoder(encoder_out)
  # 损失函数为平方差
  cost = tf.reduce_mean(tf.pow(y - pred, 2))
  optimizer
  = tf.train.RMSPropOptimizer(learning_rate).minimize(cost)
  (4)测试模型
  通过MNIST数据集中的测试集测试训练后的模型准确度,训练结果如下所示。
  Epoch: 0001 cost= 0.191340700
  Epoch: 0006 cost= 0.119541861
  Epoch: 0011 cost= 0.102257006
  Epoch: 0016 cost= 0.094441280
  训练完成!
  Accuracy: 1.0
  从上述信息可以得到,经过20个epochs训练后的效果非常好,准确率达到了100%。
  (5)图像还原
  接下来我们抽取部分还原图片的信息进行显示,结果如图2所示,其中第一行显示的内容为输入图片,第二行显示的内容为输出图片。
  4 总结
  该文首先介绍传统自编码器的特点与基本结构,分析自编码器的一般处理框架。然后,通过MNIST数据集进行自编码器的编程训练、测试和结果输出。从运行的结果来看,该网络能比较好的进行了图片的还原。说明在深度学习中用自编码网络生成的特征来取代原始数据,可以取得较好的特征提取效果。
  参考文献
  [1] 袁非牛,章琳,史劲亭等.自编码神经网络理论及应用综述[J],计算机学报,2019(01).
  [2] 苗宇宏等.基于深度卷积自编码网络的图像融合[J],计算机应用研究,2020(6).
  [3] 王曉华. TensorFlow 2.0卷积神经网络实战 [M]. 清华大学出版社出版社,2020
  作者简介:翟高粤,男,1975.11,广西钦州,汉,硕士,副教授,研究方向:软件理论,人工智能。
其他文献
摘要:供电企业的抄表、核算以及收费存在一定的严谨性、复杂性,从某种程度上而言,直接影响整个电力企业的经济效益,所以对于电力企业的电费抄核收缴工作就显得尤为重要。本文分析了我国电企抄核收工作存在的问题,结合实践工作,阐明相应问题的解决对策。  关键词:供电企业;抄表;核算;收费;问题;策略  引言:电企业的抄表、核算以及收费是电力管理重要的组成部分。所以做好我国电力企业的抄表和核收工作至关重要,只有
期刊
摘要:在现代化教育理念中综合素质教育是我们重点研究的内容,加强教育工作整体质量,在教学过程中夯实学生基本知识是当前高中历史教学的重要教学目标。为了更好的契合新课改相关要求,进一步提升高中历史教学质量,我们应该从教学方式上入手,认识到传统课堂教学理念的短板,利用当前课堂教学优质教育资源来以多样化教学手段帮助学生理解并记忆相应的历史知识。情境教学是现代化高中教学工作中的常用教学手段,通过情景代入的方式
期刊
摘要:近年来,我国技术人员对信息技术的研究力度不断增加,信息技术的应用范围也在逐渐增加,目前很多行业因为引进了信息技术,使得行业发展速度得到了进一步的增加,因此电力企业为了保证自己的市场竞争力,保证自己的经济效益,在日常工作过程中也应该尝试融入信息技术,本文以用电信息采集技术在电力营销工作中的应用为例,做出了具体讨论,供工作人员参考使用。  关键词:电力营销;用电信息采集技术;应用;经济性  引言
期刊
摘要:房屋建筑项目旨在为人们提供一个舒适、温馨的建筑空间的同时,保障人们生命财产安全。项目建设中以及经过长时间应用,会在众多因素影响下出现结构问题,及时采取房屋建筑加固措施,提高房屋建筑结构的使用性能十分关键。本文基于房屋建筑结构加固的重要性,从加固技术原则、加固设计方法、加固施工应用等多角度探讨了房屋建筑结构加固设计与施工,以期对相关从业人员提供理论参考,促进我国房屋建筑领域发展。  关键词:房
期刊
摘要:线损作为反映电力企业技术、经济指标的重要因素,决定了企业的经济发展。本文主要分析了线损管理与在线监测技术,从实际角度出发,分析了现阶段电力线损管理存在的问题,提出了电力系统线路损耗的科学控制,实现了防控窃电行为的发生,规避堵塞电力线路计量故障的漏铜,构建了现代化、高效化线损防控模式。  关键词:电力系统;线损管理;在线监测技术;分析;应用  引言:  电力系统在运行的过程中,由于多种因素的影
期刊
摘要:电能计量的采集运维以及故障处理,是电力企业发展以及生活电力稳定性的重要因素。随着社会用电需求逐渐提高,且对于供电质量要求的提升,使得电力企业面临了全新的挑战。本文依托电力系统运作效率为基础,分析了电能计量采集方法,阐述了电能计量采集运维的重要性,讨论了电能计量采集运维以及骨折处理的方式。  关键词:电能计量;采集运维;故障处理;分析  引言:  在电力生产的过程中,计量作为其系统重要因素,在
期刊
摘要:档案信息较为完整地记录了基层单位的发展历程。然而,随着基层事业单位的不断发展,产生了大量的档案信息。作为基层事业单位,只有不断更新与优化档案信息管理方式,方可以更好地提升档案管理工作效率与质量。本文分析了基层事业单位档案管理信息化管理途径。希望相关工作者可以从中得到一定的帮助。  关键词:基层事业单位;档案管理;信息化管理;途径  1 引言  档案信息数量的急剧增长,带来的往往是档案管理人员
期刊
摘要:社会经济变革时代下,供用电为人们生产、生活提供了多元化的支持,加之人们生活质量不断提高,对电能的需求逐渐提升,这一举措对电力企业电量采集提出了一定的挑战。且在竞争逐渐激烈的电力市场下,电信息采集技术为电力营销提供了有力的支撑,因此,为了全面保障电力营销工作的有效性,应对电信系采集技术进行科学、合理的应用,以此推动电力营销工作服务质量,为电企创造更多经济效益。  关键词:电力营销;用电信息;采
期刊
摘要:随着计算机技术的不断发展和成熟,越来越被人们所接受和使用。计算机技术在各个行业的实际应用中,带来了很好的应用效果。而对于殡葬行业而言,计算机技术的应用,无疑是带来了新的发展契机。计算机技术的应用给殡葬网络服务建设提供了基础条件,为殡葬资源的整合和利用提供了便利。本文就计算机技术的应用给殡葬行业带来的发展新契机进行分析。  关键词:计算机技术;殡葬行业;发展契机  殡葬行业作为第三产业中极为特
期刊
摘要:目的:研究新的动脉化疗技术在临床中辅助治疗妇科宫颈癌的临床应用价值。方法 根据纳入排除标准将纳入的研究对象分为常规治疗的对照组和以新辅助动脉化疗技术治疗的观察组,根据WHO实体癌评价标准中所划分的疗效的四个类别进行划分,并进行统计学分析。结果 观察组在术中出血、治疗有效率以及低转移和少浸润方面都优于对照组;。结论 新辅助动脉化疗技术在妇科的恶性肿瘤的治疗中,在提高手术有效率以及提高术后病理预
期刊