表示学习的高效算法

来源 :清华大学 | 被引量 : 1次 | 上传用户:cairaymond
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表示学习是人工智能领域的核心研究问题之一。许多成功的模型都可以被理解成是表示学习的特例,这包括用概率建模隐变量和观测变量联合分布的隐变量模型,以及端到端学习层次化表示的深度模型。在大数据时代,表示学习模型通过利用数据中丰富的信息,得到了远超人工特征的模型效果。然而,大数据量也对表示学习的效率提出了严峻的挑战。随机算法的噪声、近似优化算法的不稳定性、高时间复杂度等都影响了表示学习算法的效率。本文基于方差缩减、拒绝采样、访存优化等技术,研究了隐变量模型和深度表示学习两类模型的高效算法,并研究了这些算法在文本分析、生成式模型、图节点分类等多个任务中的应用。具体地,本文创新点有:1.提出隐变量模型的方差缩减EM算法,并给出了其局部收敛速度和全局收敛性的理论结果。2.提出了缓存高效的O(1)时间复杂度主题模型采样算法,该算法较之前算法提速了5-15倍,且能扩展到数亿文档、数百万主题、上万CPU核的场景。3.提出了结构化主题模型的高效算法,具体包括层次化主题模型的部分坍缩吉布斯采样算法,将该模型扩展到了比之前大5个数量级的数据集上;以及有监督主题模型的坐标下降、拒绝采样算法,较之前算法加速4倍。4.提出了总体匹配差异,一个两分布之间距离基于样本的估计;证明了总体匹配差异的一致性,并讨论了其在领域自适应、深度生成模型上的应用。5.提出了一个基于控制变量的图卷积网络高效随机训练算法,并给出了其收敛性证明和实验结果,较之前算法收敛速度快了7倍。
其他文献
[本刊讯]中国南车于2015年6月1日完成工商变更登记手续,取得了北京市工商行政管理局换发的《营业执照》(注册号为100000000041417)。变更后的公司中文名称为中国中车股份有限
会议
为解决保鲜运输用高压雾化加湿系统设计问题,建立了高压雾化加湿系统的试验平台。通过改变风速、开孔率、回风道长度等因素,研究各因素对加湿系统加湿效率和湿度分布的影响,
随着网络的快速发展,网络购物日益成为人们日常生活的一个重要组成部分。同时随着网络购物模式的逐渐成熟,企业也不断完善网上渠道布局并运用更加丰富的促销手段来吸引消费者。在网上促销活动中,越来越多的商家在提供价格折扣的同时会对产品的购买可得性做出一定的限制,如对折扣产品设置时间或数量限制,以此来刺激消费者购买、促进产品销售。文章基于价格折扣促销及产品稀缺性促销相关理论,结合现实营销问题,探讨了在网上促销
语言的人际功能是指人们可以通过语言表达自己的态度,建立并维持与他人的人际关系,并试图影响他人对某人或事的看法。在文学作品中,作家写小说的目的,就是要将自己的意识形态
莎士比亚作品一直是英美文学关注的焦点。由美国著名学者Amy L.Tigner所著的《伊丽莎白一世至查理二世时期文学与文艺复兴花园:英格兰的天堂》认为,作为文学作品中的一个重要
济宁青山羊(Jining Grey Goat)是我国著名的地方山羊品种,以高繁殖力为特点入选国家畜禽品种志,是山羊繁殖力性能研究的理想动物模型。山羊作为重要的家养动物,其遗传多样性
民法典是新中国成立以来第一部以"法典"命名的法律,是一部固根本、稳预期、利长远的基础性法律,是新时代我国社会主义法治建设的重大成果。为深入学习贯彻习近平总书记关于实
笔者以李斯特的《彼得拉克十四行诗104号》为主要研究对象,针对作品中所蕴含的矛盾美进行分析与研究。本文将分为四个部分进行具体论述:一、从彼得拉克十四行诗的文学角度出发,初步解读何为矛盾美;二、分析作品各乐段不同音乐性格之间的个性与共性;三、探讨节奏在自由与规整之间的统一;四、通过梳理佛拉基米尔·霍洛维茨对作品个性化的演奏阐释,旨在加深对矛盾美的理解,以及对自身的弹奏有所启迪。
随着世界农业技术的持续发展,我国当前社会下对于农业工程技术的应用也越来越广泛。目前,在农业工程领域中,超声雾化喷头主要是流体式喷头与压电换能器式喷头。流体动力式喷
对西昌钢钒酸轧机组带钢边部欠酸洗缺陷产生原因进行了分析,并提出了一系列的改进措施。生产实践表明,减少了边部欠酸洗缺陷,降低了欠酸洗缺陷因素不合格产品率,取得了显著的