Convergence Theory of Large Margin Learning

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:richieli333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是统计机器学习理论中最重要的问题之一,其在计算机科学、工程、医学等领域有着广泛的应用.解决分类问题的算法很多,从经典的基于分布的似然方法,如logistic回归和Fisher线性判别分析,到基于间隔的方法,包括著名的支持向量机,每种类型的算法都有各自的优点.本论文主要考虑基于一类Lipschitz凸损失函数的大间隔两类分类算法,该类算法不仅可以克服支持向量机算法在高维小样本数据中遇到的数据堆积现象,还统一了基于分布和基于间隔的分类算法.本论文旨在为上述算法建立系统的误差理论.首先,本文考虑了独立同分布抽样下的大间隔分类算法,详细地研究了在各种参数选择下大间隔统一机损失函数的比较定理,该定理刻画了超额错误分类误差与大间隔统一机损失函数定义的超额推广误差之间的定量关系,该结果在误差分析中起着关键的作用,它使得通过经验过程进行误差分析成为可能.基于所得到的比较定理,我们进一步推导了在独立同分布采样假设下基于变高斯核的大间隔统一机学习算法的学习率.变高斯核相较于单个高斯核而言具有更强的函数逼近能力.其次,本文将大间隔分类算法的研究扩展到非独立和非同分布的采样过程中.通过构造一个独立的块序列,将对弱相关样本序列的分析转化为独立块序列的分析.在处理非同分布抽样时,假设边际分布函数满足多项式收敛.我们利用误差分解技术将总误差分解为样本误差,正则化误差和漂移误差.漂移误差是基于不同边缘分布采样所引起的误差,在独立同分布采样中该项误差为零.本文引入了一种新的投影算子克服目标函数无界带来的技术困难.利用再生核希尔伯特空间理论,覆盖数技术及迭代算法等得到了非独立和非同分布采样下的大间隔分类算法的快速学习率.最后,我们研究了处理不平衡数据的加权广义距离加权判别法.标准的距离加权判别法只适用于平衡数据.首先证明了加权广义距离加权判别法的正则化等价形式,并通过核技巧将其推广到非线性问题;然后证明了加权形式的比较定理,并利用误差分解技术、集中概率不等式、高斯核生成的再生核希尔伯特空间覆盖数的紧界估计等对加权广义距离加权判别法进行了误差分析,并得到了具体的学习率.本文采用的变高斯核相较于单个高斯核而言具有更强的函数逼近能力,提高了加权广义距离加权判别法的学习率.
其他文献
人工神经元模型成功模拟生物神经元的工作机理和放电模式,对于实现大脑的工作模式和构建类脑网络系统具有潜在的重要意义和关键作用。受生物启发所构建的人工神经元模型研究中,最为突出的就是艾伦·劳埃德·霍奇金(Alan Lloyd Hodgkin)和安德鲁·菲尔丁·赫胥黎(Andrew Fielding Huxley)所研发的第一个电信号沿鱿鱼巨型轴突传播的定量模型,即霍奇金-赫胥黎(Hodgkin-Hux
学位
肝脏作为脊椎动物重要的消化和代谢器官拥有显著的再生能力。在急性和轻度肝脏损伤的情况下,成熟的肝细胞和胆管上皮细胞通过其强大的增殖能力可以帮助恢复肝脏的体积和功能。虽然正常肝脏有很强的再生能力,但在急性损伤或肝脏切除后,这种强大的再生能力在两种基本情况下会遭到严重削弱:一种是出现严重急性肝损伤,另一种是伴随肝脏结构异常和明显的肝纤维化的出现严重的慢性肝损伤。这些异常情况具有临床上的相关性,并且通常会
学位
自2005年到2021年,中学生心理健康多项元分析指出:我国中学生心理健康状况在逐年变差;教育、社会、经济等因素能解释其不到20%的变异。但是,尚没有研究探讨过个体因素,如作业时间对"变差"的作用。那么,作业时间与中学生心理健康之间的关系如何?为回答此问题,有两组数据进入了横断历史元分析(Cross-temporal meta-analysis)。一组是2002至2021年间使用《中学生心理健康量
会议
在长期自然演化过程中,昆虫对多变的环境具备高度的适应能力与其变态发育密切不可分。昆虫的变态类型多种多样,但无一例外都经历着旧器官的消亡和新器官的重建。卵巢作为雌性生殖系统的重要组成,在昆虫幼虫-蛹的转变过程中发生变态发育,其外膜退化,卵巢管快速生长,确保卵巢内卵子的正常发育及成熟。此外,部分器官也会在昆虫每个龄期的更替过程中发生更新发育,如:气管在每次眠起后随蜕皮过程去除原有的结构,形成更庞大的气
学位
忆阻器是阻值可变的第四种基本电路元器件,具有纳米级尺寸、非线性、记忆性和低功耗等特性。在非线性混沌电路中引入忆阻器,有利于产生更为复杂的混沌信号,还能改善混沌信号的复杂度。因而,构造动力学行为复杂的忆阻器混沌电路具有实际意义。此外,尽管目前对于混沌与分形的研究早已成熟,却鲜有将分形过程应用于混沌系统产生复杂的多涡卷混沌吸引子。经过分形过程处理后的混沌系统具有更高的序列复杂度和良好的随机性,其在图像
学位
以环氧乙烷/环氧丙烷嵌段聚醚和丙烯酸作为主要聚合单体,分别选用含酰胺基团的丙烯酰胺和2-丙烯酰胺-2-甲基丙磺酸作为功能单体,在常温常压下合成早强型聚羧酸减水剂。考察聚合体系中丙烯酸用量、氧化还原体系、链转移剂、反应温度等因素对产品性能的影响。结果表明,在n(聚醚单体)∶n(丙烯酸)∶n(丙烯酰胺)=1∶8∶0.24、H2O2/抗坏血酸氧化还原体系、温度40℃条件下制备的减水剂早强效果最优。与掺常
期刊
病毒是严格的细胞内寄生生物,其复制增殖取决于对细胞的适应和调控。许多病毒通过调控宿主细胞周期进程来促进自身复制增殖是其致病机制中的一个重要特征,阐释病毒与细胞周期之间的关系对于更好地解析病毒与宿主相互作用的机制具有重要的生物学意义。家蚕不仅是鳞翅目昆虫的重要模式,也是重要的泌丝经济昆虫。家蚕核型多角体病毒(Bombyx mori nucleopolyhedrovirus,Bm NPV)是家蚕主要的
学位
胭脂鱼(Myxocyprinus asiaticus)是胭脂鱼科(Catostomidae)在中国的唯一分布物种,为胭脂鱼属(Myxocyprinus)的唯一种,是我国特有的国家二级重点保护动物。生产实践中,胭脂鱼幼鱼由于急性氨氮中毒导致大批量死亡的现象常有发生,本研究首次测得胭脂鱼幼鱼分子氨安全浓度为0.036 mg/L,相比较同规格其他鱼类,其氨氮耐受力非常低,有潜力成为水体氨氮污染的一种新的
学位
肝脏是人体内最大的消化器官,在维持机体的多种生理代谢中具有不可替代的作用。肝脏中主要行使功能的器官是肝实质细胞,负责机体代谢的多种功能:可以合成胆汁,存储血糖为肝糖原,对各种药物进行代谢和解毒等功能。然而在受到病毒感染、肝癌和遗传因素的影响,肝脏会发生病变导致终末期的器官衰竭。对于很多病人来说,肝脏疾病晚期的唯一有效的治疗手段就是肝脏移植,然而由于肝脏供体是十分有限的,而且肝脏供体也不适用于某些肝
学位
图的染色问题是图论中一个核心问题.以此为出发点,人们提出并研究了许多(更加广义的)染色概念.本学位论文研究了其中一些染色概念及其相关问题,主要包含广义符号图的染色,图的强分数选择数,图的广义染色数,图的孪生宽,集合系统的(组合)差异性,以及χp-有界图类.符号图(G,σ)是指在图G的基础上给边集加一个映射σ:E(G)→{+1,-1}使得图G的每条边e都有一个符号σ(e)∈{1,-1}.在符号图的一
学位