基于和积网络的表示学习研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:baoxiuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术在计算机视觉领域,自然语言处理领域和语音处理领域取得了飞速的发展和极大的成功,其中表示学习领域研究的不断进步对这次深度学习技术的崛起起到了极大的促进作用。学习良好的数据嵌入与特征表示,使得在构建预测模型或者分类器时更容易从数据中提取有用的特征信息。然而,目前主流的深度学习模型存在黑盒属性,缺乏相应神经科学的理论性指导。主流的深度学习模型不能进行推理任务。深度学习模型的结构往往是固定的,缺乏对应的结构学习算法。深度学习的研究主要围绕着有监督的深度学习,主流深度学习模型的训练离不开大规模的人工标注数据。但是大规模人工标注数据的获取是非常困难的,甚至在一些任务中是不可能的。因此,使用半监督或者无监督的深度学习成为迫切的研究需求。近年来,在无监督深度学习领域,自动编码器取得了广泛的成功。但是传统的深度自动编码器存在很多局限性,比如:首先,自动编码器模型中编码器与解码器存在结构对偶属性,但在传统的自动编码器模型应用中,这点被忽略。其次,编码器与解码器的训练过程是分离的,编码器与解码器之间的反馈信息没有共享。针对上述问题,本文研究一种新型的概率深度学习模型和积网络。和积网络模型具有递归概率语义,具有很强的理论性支持。和积网络能进行精确推理,其结构可以使用结构学习算法从数据中生成网络结构。基于和积网络的这些优点,本文提出一种层次和积网络作为特征提取器并设计改进的和积网络结构学习算法。受到对偶学习启发,本文还提出一种基于对偶和积网络的自动编码器架构。本文的主要工作概述如下:1、本文首先介绍了和积网络的相关基本知识。第二,说明了和积网络的推理模式。然后,介绍了和积网络的生成式与判别式参数学习方法。最后,介绍了和积网络的主流结构学习方法。2、对和积网络在两个方面做出了改进。第一,提出了层次和积网络特征提取器。首先,重构和积网络结构。然后,排列和积网络节点为层次顺序结构,同层包含相同节点,不同层包含不同节点。最后,增加输入层输出到每一个和积网络的隐藏层。第二,提出了一种改进的和积网络结构学习算法,首先,在实例变量矩阵划分之前,将其分为两部分,然后引入树分布作为叶子节点分布。最后,引入变量熵值限制变量划分过程。3、为了验证层次和积网络作为特征提取器与改进和积网络结构学习算法的性能,本文进行了大量的对比实验。首先,可视化层次和积网络的样本生成。然后,可视化层次和积网络的特征提取。最后,使用层次和积网络进行图像分类任务,对比模型RBM,DBN,MADEs和VAE,证明了层次和积网络在特征提取与图像分类的优越性能。本文还设计了改进的和积网络结构学习算法对比传统和积网络结构学习算法Learn SPNs的实验,在模型参数统计与平均测试逻辑似然函数指标中验证了改进的和积网络结构学习算法的有效性。4、提出了对偶和积网络自动编码器。首先,设计其结构作为对偶闭环。然后,引入概率结构对偶正则化项监督对偶和积网络的自动编码器训练过程。最后,同时训练对偶和积网络自动编码器中的SPNs编码器与MPNs解码器,使反馈信息在两个模型中共享。5、为了验证对偶和积网络自动编码器的表示学习能力,本文设计了数据集嵌入重构实验与多标签分类任务实验。实验结果证明,对偶和积网络自动编码器相对于传统和积网络自动编码具有更优的嵌入重构能力。对偶和积网络自动编码器相对于传统和积网络自动编码,MADEs,RBM,SAE,CAE和DAE模型都具有更优的JACCARD,HAMMING和EXACT MATCH分数。
其他文献
本研究针对偏远地区饮用水中无机物以及有害菌污染难以处理的问题设计了实验。本文基于介电泳法去除饮用水中无机物与有害菌。根据不同的污染物类型,本研究采取了介电泳增强
我国高职艺术设计专业可在德国“双元制”人才培养模式的基础上,在我国职业教育的理论和实践指导下进行校企协同创新创业育人模式的基础上进行探索和实践。
目的 探讨胃癌患者手术前后血清糖链抗原CA72-4、CA19-9和CA50的变化及其临床意义。方法 用免疫放射分析法(IRMA)分别检测了122例胃癌患者手术前后、46例胃良性疾病患者和38例
李洱是中国新生代中一位独具特色的作家,其作品在内容和形式上具有深刻的复杂性和探索性。与大多数河南作家不同,他的作品较少涉及多数河南作家钟爱的河南乡村题材,他更多关
大学导师辅导班运动是英国成人教育史上至关重要的运动。它是英国大学和工人教育协会于1907年创建并由两者形成联合委员会实施管理,以导师辅导班为组织形式为工人阶级提供以
参数回归模型简单方便,应用较为广泛,但目前简单的参数均值回归模型并不能很好的满足生活中的复杂数据。一方面是因为对于模型来说,参数模型是事先对模型作出假设,给定一个具体的模型形式,在一定假设条件之下,然后利用该固定模型对数据进行分析,而实际数据复杂多变,对于面板数据而言,包含信息更丰富,一般的参数模型已经不能很好的满足数据要求。另一方面,从模型随机误差项分布来说,现有的模型基本都是假设其服从规范的正