机器学习中损失函数的若干问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：andykiteelxu

【摘要】

：

“学什么”是机器学习中首要的基本研究问题，“学什么”在计算层面上对应机器学习中损失函数的设计，损失函数得合适与否直接决定了机器学习模型的性能好坏。给定训练样本数据，损

【作者】

：

樊艳波

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

机器学习聚合损失度量学习自步学习隐含正则子

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

“学什么”是机器学习中首要的基本研究问题，“学什么”在计算层面上对应机器学习中损失函数的设计，损失函数得合适与否直接决定了机器学习模型的性能好坏。给定训练样本数据，损失函数的设计通常包含:单个样本损失函数的设计，样本集上聚合损失函数(Aggregate Loss)的设计以及模型正则项的设计。目前关于聚合损失函数的分析和研究比较欠缺，典型的平均损失和最大损失各有优缺点，无法很好地拟合真实数据各种复杂的分布，如类别不平衡分布等。鉴于此，本文提出了平均Top-K(Average Top-K，ATk)损失作为一种新的聚合损失函数并对其理论性质进行分析和研究，ATk损失可以更好地拟合数据的不同分布。本文将ATk损失应用于度量学习（Metric Learning）中，缓解了度量学习中存在的原空间和变换空间中样本局部结构不一致性和样本难易程度不一致性等问题。另一方面，目前基于自步学习(Self-Paced Learning)的优化策略在非凸优化中得到了越来越多的关注和发展，但其理论分析非常欠缺。本文从隐含正则化的角度出发对自步学习的学习目标以及其对噪音数据和异常样本的鲁棒性原理进行分析和探讨。本文取得的主要研究成果如下　　1.针对聚合损失函数，本文分析了平均损失、最大损失和第k大损失等聚合损失的优缺点，并提出了平均Top-K损失函数。ATk损失函数定义为样本集上前k个最大损失的平均值，其包含了平均损失和最大损失，并且是第k大损失的凸上界。相比于平均损失和最大损失，ATk损失能够更好地拟合不同的数据分布，特别是不平衡数据和多分布数据。ATk损失是一个非常通用的聚合损失函数，其可以和任何定义在单个样上的损失函数结合起来，并且是单个样本损失的凸函数。本文分并推导了二分类问题中ATk损失的分类校准(classification calibration)性质和k值的关联，由此给出了k值的一个理论下界。本文将ATk损失和hinge损失结合起来提出了ATk-SVM模型，并给出ATk-SVM模型的可达误差上界。最后在仿真数据集和真实数据集，以及在分类问题和回归问题中都验证了ATk损失的有效性。　　2.针对度量学习中存在的原空间和变换空间中样本局部结构不一致性和样本难易程度不一致性问题，本文提出了基于平均Top-K损失的度量学习模型ATk-DML。ATk-DML模型在保持相似样本对之间距离的上界的同时最大化距离最近的前k个不相似样本对之间的距离。本文提出了一个高效的算法用以ATk-DML模型的求解并在仿真数据集以及真实数据集上都验证了ATk-DML模型的正确性和有效性。　　3.针对自步学习，本文从凸共轭角度出发提出了自步隐含正则子，分析并指出基于自步隐含正则子的自步学习模型SPL-IR的优化求解过程对应于一系列隐含的鲁棒原损失函数的最小化，并以此分析了自步学习对噪音数据和异常样本具有一定鲁棒性的原理。此外，本文分析了SPL-IR模型和半二次优化(Half-Quadratic Optimization)之间的关联，并提供了一组鲁棒原损失函数诱导的自步隐含正则子。最后，在仿真数据集和真实数据集，以及在矩阵分解和多模态聚类中都验证了SPL-IR模型的正确性和有效性。

其他文献

基于稀疏判别分析的脑电信号特征提取与分类

脑机接口(Brain-computer Interface，BCI)是脱离了人体的外围神经系统和肌肉组织，直接建立起人脑和计算机或者其他外围设备之间的信息交互通道，借此，人们可以通过控制自己的思维

学位

脑电信号特征提取稀疏判别共空间模式

面向物流应用服务的多代理平台的研究与实现

随着信息技术和第三方物流快速发展,物流过程在供应链管理的内在价值不断提高,为广大企业提供一个物流信息发布、信息检索、信息交换的物流信息系统能够提高企业的供应链管理

学位

物流多Agent系统(MAS)Agent模型XMLUML

一种工业无线检测系统的设计与实现

近年来，随着无线技术与以太网技术的进一步发展和完善，特别是通讯速率的提高和新的交互技术的应用，为以太网技术能应用于工业现场检测领域提供了新的途径;同时，工业现场对更加智

学位

工业无线检测系统以太网ZigBee技术串口通讯无线网关

基于忆阻的递归神经网络的稳定性和无源性分析

递归神经网络具有丰富的动态特性，在实际工程中广泛应用。随着新兴电子元件——忆阻的发现，用忆阻代替传统电阻构建新的递归神经网络并分析其动态特性成为一个研究热点。在实际

学位

忆阻递归神经网络无源性稳定性

基于改进K-均值聚类算法的睡眠分期研究与应用

睡眠，作为人体非常重要的一种生理活动，其质量的好坏对人身体健康、生活等有着密切的影响。在现代社会，各方面的压力和不健康的生活习惯严重影响着人们的睡眠，睡眠已经成为医学、

学位

睡眠分期K-均值聚类脑电信号频域特征

H<,∞>控制理论在仿真转台控制中的应用

转台是一种高精度的测试、仿真设备,影响转台精度的主要因素是作用在转轴上的各种干扰力矩.同时,转台系统中存在的各种不确定性,也影响控制系统的性能.因此对转台控制系统的

学位

仿真转台不确定性H控制鲁棒性混合灵敏度

兰州市交通决策支持系统

兰州市作为中国西北部地区的重要城市，近年来，经济增长迅速，原有的交通体系已不堪重负。改善城市交通基础设施和提高城市交通服务水平、促进城市交通良性发展，尽快建立兰州市交通

学位

交通规划决策支持系统数据库模型库公交系统兰州市

基于Java的网络虚拟实验室的构建

该论文以计算机技术为核心,以现代教育技术及网络技术为依据,在传统的图形电路仿真软件和网络课件的基础上,提出了构建网络虚拟实验室的思想.该实验室系统的研制既可针对电气

学位

网络虚拟实验室Java电路仿真伏安法测电阻

基于μC/OS-Ⅱ的交流采样远动终端的研究与设计

嵌入式系统是当前计算机最普遍的应用形式，系统由硬件和软件两部分组成，通常通过启动装置来控制系统中机械部分的动作，利用传感装置获得系统的输入信息，利用数据处理部件对相关信

学位

μC/OS-11嵌入式系统嵌入式应用开发任务优先级抗干扰嵌入式操作系统交流采样远动终端

学习控制在机器人避障路径规划中的应用

该文介绍了学习控制在智能机器人避障路径规划中的应用和在Vc++6.0环境下的模拟结果.论文阐述了学习控制的发展历史、基本原理和应用现状,介绍了基于神经网络结构的机器人路

学位

智能机器人神经网络路径规划模拟退火学习控制

机器学习中损失函数的若干问题研究

与本文相关的学术论文