基于Autoencoder的高维数据降维方法研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:cscbob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年以来,随着科技的进步和社会的发展,尤其是数据的搜集和存储容量的急剧扩张,在很多科学的领域内都或多或少的导致了信息过载问题的发生。研究人员在面临诸如天文学、工程学、生物学、遥感、经济学、消费者交易等广泛的领域内的日常工作中都不得不面对越来越大的观察数据和仿真数据。这些大数据通常都是高维的,由于维数灾难的存在,传统的处理小数据的方法已经不足以胜任了,因此人们必须提出一些新的方法出来。降维技术是处理这些问题的一种行之有效的方法。在过去的几十年以来,降维技术得到了快速的发展,这些方法之中有些是线性的,如PCA等;有些是非线性的,如LLE, SNE, Autoencoder等。这些方法各有各的优点,同时也各有各的缺点,它们在不同的领域都发挥着各自重要的作用。本文的研究重点是基于Autoencoder的降维方法。所谓Autoencoder其实是一种特定的神经网络。神经网络是人们为了模仿动物大脑机能的驱使下通过不断努力的研究而逐渐形成的一种多交叉学科的前沿技术。神经网络的结构通常由输入层、隐藏层、以及输出层组成。当一个神经网络通过给定的数据(其中的一部分作为训练数据)学习完毕后,那么这个神经网络就有了辨别这种数据某些特征的能力。因此它的这种能力可以应用在人脸识别,语音识别的领域。如果Autoencoder的中间层(隐藏层)的节点数远小于输入层(或输出层)的节点数,那么它就可以用来降维,其中隐藏层上神经元的输出就是高维数据在低维空间的表达。G. E. Hinton和R. R. Salakhutdinov在2006年提出了一种Unfolded Autoencoder的神经网络,紧接着在2012年,Jing Wang等人在其基础上提出了改进版本:Folded Autoencoder的神经网络。本文在对上面那两种网络研究的基础上,提出了一种改进Folded Autoencoder神经网络结构的方法。
其他文献
随着知识经济的到来,特别是中国入世后,医院之间的竞争日益激烈,为提高竞争力,追求更高的经济和社会效益,医院越来越意识到护理服务的重要性[1].……
期刊
护理风险管理是一个护理管理程序,对护理工作中现有或潜在的护理风险识别、评价和处理,以减少护理风险事件的发生及风险事件对患者和医院的危害及经济损失。精神科患者由于受精
《学记》成书于战国后期,是先秦时期儒家教育经验与教育思想的总结。是中国古代教育文献中最早、体系比较严整而又极有价值的一篇,是我国教育史上的一份极为珍贵的遗产;也是世界
数据表示的成功与否直接关系到数据的理解和存储,因此其对于机器学习任务和人工智能的实现都至关重要。而自动编码器就是为解决数据表示问题而提出的神经网络模型。由单隐层
得出了在随机逻辑的词义问题中,标准命题演算系统的每条公理在随机逻辑中都是模糊恒真的,但标准命题演算系统的定理,在随机逻辑中却不都是模糊恒真的.
Fermat大定理虽告解决,但研究其新证明或初等证明仍有意义.该文推广了Perisatri的两个命题,还获得了另外几个关于Fermat方程第一情形的新结论,而所用的方法是初等简洁的.
胃癌术后辅助化疗是改善患者预后的重要方法。术后辅助化疗的作用已被明确,但目前在首选术后辅助方案上仍未达成统一的全球共识。尽管治疗方案因地区而异,但各种推荐辅助化疗
该文从福绵管理区乡镇企业发展现状入手,重点分析了该区发展乡镇企业的有利条件,提出了加快福绵管理区乡镇企业发展的措施与对策.