【摘 要】
:
间隔理论的相关工作表明,相比于最大化样本的最小间隔,优化间隔分布可以带来更好的泛化性能。最优间隔分布学习机正是基于这样的间隔理论提出的全新统计机器学习框架,并在大量机器学习任务中展示出了极佳的通用性和极好的泛化能力。然而,由于需要引入非线性核函数以解决线性不可分问题,其计算核矩阵的时间复杂度和空间复杂度都与样本数量相关,因此在训练数据集较大的情况下,训练最优间隔分布学习机所需的计算和存储资源都是难
论文部分内容阅读
间隔理论的相关工作表明,相比于最大化样本的最小间隔,优化间隔分布可以带来更好的泛化性能。最优间隔分布学习机正是基于这样的间隔理论提出的全新统计机器学习框架,并在大量机器学习任务中展示出了极佳的通用性和极好的泛化能力。然而,由于需要引入非线性核函数以解决线性不可分问题,其计算核矩阵的时间复杂度和空间复杂度都与样本数量相关,因此在训练数据集较大的情况下,训练最优间隔分布学习机所需的计算和存储资源都是难以接受的。可扩展最优间隔分布学习机正是在这个背景下提出的。对于非线性核最优间隔分布学习机的训练,提出了一个全新的保持数据分布的数据划分方法,以使得每个小数据分区内训练的局部最优间隔分布学习机都可以与全局的模型更相似。在小分区内的训练完成后,算法将多个小分区合并成新的大分区,并将小分区上得到的局部最优解合并为初始解继续训练,以此达到更快的收敛速度。对于线性核最优间隔分布学习机的训练,一种通信高效的分布式方差减少的随机梯度算法被引入其中,以加速模型的训练。相关的理论分析证明,这样的优化方法在优化最优间隔分布学习机模型时可以保证收敛,并达到线性收敛率。实验结果表明,该方法在面对大数据集时有着超越其他可扩展学习算法训练速度。在分布式的集群中,可扩展最优间隔分布学习机达到了接近十倍的加速效果,且几乎不会削弱模型的泛化能力。
其他文献
在城市室内公共场所发生如火灾、停电、恐袭等突发事件时,如何实现安全有效的人群疏散规划,防止造成人群踩踏或其它安全事故,是一个亟待解决的问题。已有人群疏散研究广泛认为通过技术手段实时控制人群流动是解决问题的关键,而现有的人群疏散规划算法主要还停留在基于静态环境信息的路径规划,对复杂的疏散环境变化难以做出即时响应,也缺少对目标人群进行实时疏散引导的能力。因此通过对基于深度强化学习的疏散路径规划算法展开
近年来,我国光伏产业快速发展,虽然目前光伏产业的主力军仍是硅基太阳能电池,但新一代薄膜电池也进入了人们的视野,如已经产业化的薄膜太阳能电池技术有Cu(In,Ga)Se2(CIGS)和Cd Te,但因为CIGS中的铟元素比较稀有,Cd Te中含有重金属元素,所以亟需寻找含量丰富的、无毒的新型材料。在本文中,对具有巨大潜力的Sb2S3太阳能电池进行系统研究,通过对Sb2S3太阳能电池中电子传输层(El
光纤传感因其灵敏度高、传输容量大、抗电磁干扰等特点,广泛应用于结构监测、医疗诊断、生化检测等方面。光纤布拉格光栅作为光纤传感和光纤通信中应用最广泛的无源器件,其依赖于精确的解调方案探测布拉格中心波长的漂移。现有的光纤布拉格光栅解调方案无法兼具高解调精度、高解调速度、大复用容量,大动态范围、高系统稳定性和低成本等优点。因此,本文提出一种基于热导啁啾和神经网络的光纤光栅解调方案,利用直接调制激光器内部
本文是主要研究中国期货市场处于一个飞速发展阶段,从国家红头文件落实到证监会下达措施,推动期货发展,市场容量赶不上期货公司的设立,导致在市场生存中竞争激烈,主要面临的是期货公司处于强者越强,弱者被兼并的地步,分支机构逐年减少,每家公司营销服务升级,服务成本高但对应的经纪收入低,整体的营销方式大致相同,缺少差异化服务,让期货公司对于赖以生存的收入来源方式--经纪业务和营销模式如何转变成为巨大问题,本文
在党的十八大将可持续发展战略正式列入国家战略后,国家的生态文明建设逐渐进入新时期。作为推动经济增长的主力和环境保护的主体,履行环境责任已然成为企业转型升级的必然要求。虽然环境治理带来的成本支出与企业经营的盈利性目的存在的矛盾导致不少企业缺乏保护环境的动力,甚至牺牲环境以谋求短期的高速发展,但从长远发展的视角来考虑,企业主动积极履行环境责任有利于提升自身价值。诸多学者的研究表明,企业内外部的各种因素
随着混合所有制改革的不断深化,我国混合所有制改革的双向性日益凸显,民营企业逆向引入国有投资者的案例越来越多,实务界甚至出现了“国进民退”的讨论。学术界普遍认为外部民营投资者的引入对国有企业僵化的治理结构具有“鲶鱼效应”。那么,外部国有投资者的引入对于民营企业是否也同样具有积极效应?这种积极效应又是如何实现的?本文以此为切入点,对民营企业逆向混改中的控制权配置问题展开研究,试图从控制权配置与运用的角
自2013年场内股权质押市场的开放以来,股权质押以其低门槛、低成本、高效率等优点深受股东喜爱。控股股东的股权质押融资不但可以反哺企业,为企业带来充足资金,还会加剧代理问题,加大控制权转移风险。随着经济全球化、经济金融化的风靡,金融投资广受逐利资本所偏好,实体企业“脱实向虚”现象显著。因此,研究控股股东的股权质押行为是否会影响企业金融化发展十分必要,厘清其中内在的影响路径也具有重大现实意义。回顾国内
2015年,在股价大幅下跌的背景下,为了稳定公司股价,向投资者传递积极的信号,资本市场出现了一种特殊的增持方式——兜底式增持。兜底式增持与传统的由大股东直接进行增持不同,一般由上市公司大股东作为倡议人,倡议员工进行股票增持。这种增持方式以低资金成本、流程简便等优势为各大板块、各大行业的上市公司所“青睐”。近年来,由于兜底式增持的相关法规还未完善,一些上市公司实施的兜底式增持变成了一种“忽悠式增持”
随着人工智能技术的发展,模式识别为工业物联网系统提供了更高效的自动化控制与人机交互方式,已经成为实现工业化和信息化融合的主要手段。传统模型训练依赖特征分布均匀的数据输入,因此在特征分布不均匀的工业数据输入下,模型出现了失效与遗忘问题。近来有研究表明通过多次增量训练调整参数的方式,可以帮助模型适应数据流特征分布的变化。针对工业环境特征不均匀的数据流输入,提出了基于记忆回放的工业增量(Industri
社区搜索作为图挖掘的重要研究内容,能被运用到社交网络推荐、语义扩展和流行病学调查等诸多应用当中。目前的社区搜索研究主要是在静态图上进行的,无法处理现实中广泛存在的时序信息。同时,现有的研究没有对顶点在不同社区中的参与情况进行区分,而一个顶点在各个社区中的参与情况通常存在着差异,其参与更多的社区对该顶点更为重要。因此,寻找到特定顶点参与最多的社区具有重要的意义。基于上述问题,对时序图中顶点重要参与社