学习理论中的误差分析

来源 :湖北大学 | 被引量 : 0次 | 上传用户:yj8888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习问题就是利用经验数据从给定函数集寻找待求的函数依赖关系的问题.其核心问题之一就是分析处理学习问题的各种方法(或算法)的推广性能.处理学习问题常用方法之一就是基于所选函数的品质可以用风险泛函来评价这一思路.在这种情况下,从给定函数集中选取函数就足基于经验数据最小化风险泛函的问题.而经验风险最小化归纳原则(简称ERM原则)是用于解决基于经验数据最小化风险泛函问题的主要归纳原则之一;虽然ERM原则是学习理论中常用的归纳原则,但是当函数集的容量很大时,ERM原则问题的解通常是不适定的.于是,Tikhonov等引入了正则化方法;又由于经验数据是独立的条件是非常强的.故本文基于独立和相依两种不同的数据,针对上述两种不同方法(ERM原则和Tikhonov正则化方法)的学习机器的推广性能进行了研究,重点分析了混合相依数据下ERM原则和Tikhonov正则化方法的学习机器的样本误差。 由于在学习机器推广性能的研究中,函数集的容量是描述学习机器推广性能界的一个重要因素.而当一个函数集的容量是无限时,我们是不能用基于函数集容量的界来分析学习机器的推广性能的.因此,我们又对独立于函数集容量的算法稳定的方法进行了研究.本论文的主要上作及创新之处: (1)通过对独立(同分布)数据下ERM原则学习机器推广性能已有结论的研究,我们引入了算法稳定的思想来对目标函数集进行“消噪”,得到了目标函数集的-个子集.再针对这个子集,我们得到了独立数据下ERM原则学习机器推广性能的界。 (2)由于经验数据是独立的条件,无论从理论上,还是实际应用中都是非常强的.我们把独立数据下ERM原则学习机器推广性能的结论推广到相依数据情况下,研究了混合相依数据下ERM原则学习机器的推广性能,得到了α-混合和β-混合两种不同数据下ERM原则学习机器推广性能的界。 (3)我们研究了混合相依数据下Tikhonov正则化方法学习机器的推广性能,分别得到了α-混合和β-混合两种不同数据下Tikhonov正则化方法的学习机器的推广性能的界。 (4)在独立于函数集,容量的理论框架下,我们应用算法稳定的方法研究了分类学习算法的推广性能,得到了逐点假设稳定条件下基于留一经验误差估计的推广误差的界和留一稳定条件下基于留一经验误差估计的相对误差的界。
其他文献
序列密码是密码学最主要的和最重要的组成部分之一。在序列密码中,线性复杂度和k-错线性复杂度是衡量序列的密码强度的重要工具,而相关的一些著名的算法也相继被提出,如Berlekam
本文对基于双线性对的密码体制进行了研究。文章指出,Neal Koblitz提出的超椭圆曲线密码体制(HECC)与ECC相比,HECC具有在比较小的基域上提供与ECC同等级别的安全性的优势,近几年
热方程是控制理论研究的一类基本方程.近年来半线性热方程的控制问题受到了许多数学工作者的广泛关注.本文对一类半线性热方程的能控性进行了研究综述:首先,给出了线性热方程的逼
本文首先应用离散泛函分析方法对一维Burgers方程的全离散两层加权中心差分格式进行了分析.运用各种不动点原理证明了差分解的存在性,应用Sboloev空间的离散内插公式得到了差分
随着建筑高度的增加,建筑物总重量也会增加,因而对高层建筑的地基处理质量要求也越高。本文介绍了高层建筑基础设计与选型条件,分析了影响高层建筑地基极限承载力的因素,总结了高
期刊
期刊
期刊
本文主要讨论一类拟齐次系统的极限环分支和中心问题。第一章主要介绍所研究课题的来源、发展历史、研究现状以及本文所讨论的主要问题。第二章主要运用一个算法,得到五次拟齐
随着网络技术和网络规模的不断发展,Internet在为我们带来机遇和丰富的网络资源的同时,也带来了恶意入侵的风险。在网络入侵日益增加的今天,如何有效地保护系统和网络资源的
监督就是一定的社会组织,根据既定的行为规范,对某一具体对象进行的察看、督促活动。党内监督是党为了加强自身建设,通过评价、揭露、纠偏等方式,依照党章和《中国共产党党内