基于Spark的高效并行自动编码机

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:superzergking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习中一个非常关键的问题就是如何获取良好的数据特征表示,许多经典的特征提取方法是基于数据间关系或利用简单线性组合降维后得到数据的特征表示。其中深度学习算法在各种学习任务中都可以取得良好的效果,而且可以学到很好的数据特征表示。但现有深度学习算法或模型大多为单机串行实现,不能处理较大规模的数据且运行时间较长。本文设计实现了一种基于Spark分布式平台的高效并行自动编码机,该编码机可以有效地进行特征表示学习,并且利用分布式计算平台Spark对算法进行加速,优化了对稀疏数据的操作,大大提升了运行效率。本文通过
其他文献
本文采用连续离子层吸附与反应法(SILAR)制备Al掺杂ZnO薄膜,研究掺杂浓度及退火处理对薄膜结晶性能的影响;两步法化学浴沉积(CBD)制备ZnO柱状多晶薄膜,研究不同种子层数以及不同A
知识产权质押作为一种特殊的权利质押,能够充分利用知识产权的使用价值及财产价值,扩大现代经济社会的融资途径,有助于社会资源的最大化使用。我国现行担保法确立了知识产权
氮化镓(GaN)和氮化铟(InN)都属于Ⅲ/Ⅴ族直接带隙半导体,室温下禁带宽度分别是3.39eV和0.7eV。InN、GaN以及AlN(氮化铝)的合金可以实现直接带隙宽度从红外到紫外区的连续可调
斯坦利·费什是美国读者反应批评运动的代表人物。上世纪七十年代初,他从反对新批评的“感受谬见”说出发,开始了为读者反应争取权力的斗争。他激烈地反对从文本中寻找文学作
本文关注了近年来为上市公司所广泛运用的MBO并购重组方式,研究该种方式对于公司的短期股价以及长期绩效的影响。本文以99年以来已实施或正实施MBO的A股上市公司为研究样本,应
时域有限差分(FDTD)方法作为一种计算电磁学中最常用的时域方法,已经得到了广泛应用。但是由于受到数值色散和数值稳定的限制,使得该方法在计算电大尺寸的电磁问题时,需要消
随着当前数字化测量技术的快速发展,逆向工程技术已经在工程中得到了广泛的应用。逆向工程是相对于传统产品开发过程的逆过程,它是当前先进制造技术研究的热点之一,是一门实
随着人们对于光通信需求的大幅度增长,ROF技术被广泛的应用。作为ROF系统的关键器件,垂直腔面发射激光器(VCSEL)可以实现高速的内调制,目前最高的调制速率已经超过20Gbps。相
经济全球化与区域经济一体化共同发展是当今世界经济发展的重要特征。中国—东盟自贸区于2010年1月1日正式建成。自贸区建成后,如何进一步丰富和拓展自贸区建设内涵,提升中国
城市群是指以中心城市为核心向周围辐射构成的多个城市的集合体。城市群的形成是经济发展和产业布局的客观反映,并已成为发达国家城市化的主体形态。进入21世纪,中国加入世界