机器学习中的大规模优化算法

来源 :上海交通大学 | 被引量 : 1次 | 上传用户:bxybown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习方法为计算机提供了强大的数据分析能力,其在数据挖掘、计算机视觉、自然语言处理等许多领域得到了极为广泛的应用。诸多机器学习模型的训练过程均可看做解大规模优化问题,其求解过程往往涉及大量矩阵操作。高质量的矩阵近似可以大幅度提升算法的速度并减小空间开销。本文关注优化算法中的矩阵近似,通过对机器学习中常见的矩阵类型设计近似算法以提升算法的效率;同时从优化角度对矩阵近似建模,提出更合理的近似方法。这些算法可应用于高斯过程回归、在线凸优化、分解机模型等问题。本文的贡献概括如下:·本文提出了关于一般酉不变范数的正则化矩阵近似形式。正则化矩阵近似在减小近似误差的同时,还拥对正定矩阵的近似结果可逆,减小条件数的性质,为优化算法中常见的求逆操作提供了很大便利。·本文提出了谱平移Nystr?m方法,其通过对核矩阵的采样得到一个原矩阵的近似结果。对于小特征值较大的核矩阵,该算法的近似误差明显小于传统Nystr?m方法。我们将其应用于高斯过程回归,得到了好于现有算法的结果。·本文提出了鲁棒频繁方向方法,其通过额外的正则项对频繁方向方法和增量奇异值分解进行了改进。将其应用于在线牛顿法中,可自适应选择二阶信息中的正则项,从而得到一个无超参数的在线优化算法。·本文提出了针对矩阵样本分类问题的支持矩阵机模型,模型采用谱弹性网作为正则项。谱弹性网其拥有关于行(列)的分组效应,更适合对结构信息明显的样本分类问题进行约束。·本文提出了广义频繁方向方法来近似对称不定矩阵,并设计了概略追随正则化领袖算法来解在线分解机模型。算法利用分解机模型损失函数的特定结构对模型的梯度近似后,可在悔界接近精确追随正则化领袖算法同时大幅降低计算开销。·本文将频繁方向方法推广至近似一般矩阵乘积,其比基于随机采样和投影的矩阵乘法近似方法有更好的近似结果和稳定性。其在典型关联性分析、多任务学习、多标签分类等问题中有很多潜在的应用。
其他文献
以氨羧配体EDTA作为二价模板框架,设计合成以色氨酸为核心、含酪氨酸的开链式结构的生物受体分子EWY,利用圆二色光谱(CD)、荧光光谱和电喷雾质谱(ESI—MS)等分析手段研究其与碱土金
多智能体系统的能控性问题和镇定性问题是多智能体系统研究的热点,受到许多研究者的关注,有着重要的理论意义和应用价值。本文从多智能体系统对应的拓扑结构入手,利用图论、
环境胁迫,如极端温度、干旱、盐害、氧化胁迫等严重威胁着蔬菜的产量和品质。深入研究植物对逆境胁迫的响应机制,可以为蔬菜抗逆遗传改良提供新思路,从而对于提高蔬菜的产量
为了给宁南山区旱地糜子育种亲本选配提供理论依据,提高宁夏丘陵旱薄地糜子产量,通过应用主成分分析、Shannon-Weaver多样性指数和非加权配对算术平均聚类法(UPGMA)分析了46
伴随着经济的快速发展,2010年中国顺利进入了上中等收入国家行列。但是近年来,由于人口红利的消失导致的劳动力短缺、工资上涨,以及尚未在资本技术密集型产业中形成比较优势,
随着科技的发展,汽车电子技术也得到了迅速发展,逐渐趋近于人性化、智能化,因此,现代汽车电气系统结构、功能、工作原理和控制策略与传统汽车大不相同,以前的汽车各大电气系
本课题对广东省排球后备人才培养现状和对策的研究,结合国内外竞技体育后备人 才培养方面的经验和教训,找出广东省在排球后备人才培养方面所存在的问题与不足,并提出一些完善
符号之所以为符号,并不是从符号的本身上可以看出来的,是看这事物有所代表没有。假如某事物是代表他事物的,无论两者是属何性质,前者就叫后者的符号,后者就叫前者的对象。符号学是
文学史大多将美国现代主义文学分为两大独立阵营:走国际路线的世界主义作家和倡导地方主义的本土作家。本文借助当代文化地理学和后殖民研究的理论发现,对上述传统二元划分提
近年以来,中国民间资本迅速发展,民间融资和投资渠道不畅,实体经济的下行压力和转型需求不断增大,加之复杂的国际金融形势,国内民营中小企业贷款难问题日益突出,民间借贷随之