基于统计学习的非凸损失函数研究及应用

来源 :海南大学 | 被引量 : 0次 | 上传用户:maigansws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论是上世纪六七十年代建立、于九十年代中期流行起来并延续至今的一套较为完整的数据挖掘理论。统计学习理论和由此衍生出的数据挖掘技术,在生物信息学、大气物理学、环境生态学等领域以及军事、通讯等行业已被广泛研究和应用;近年来经济、金融、管理和互联网等相关行业的数据挖掘研究也逐渐成为了主流发展方向之一。相比于自然科学统计,社会科学统计所研究的对象往往与人有关。在相关的统计调查中,由于调查手段和调查对象的局限性,被获取的数据容易包含大量的多种噪声,甚至是异常数据,这会使得学习机的稳定性与结论的可靠性被严重削弱。如何减弱噪声对模型的影响是一个经典的数据挖掘问题,这在很多社会科学领域的研究中尤为突出,因此对于复杂的噪声数据的分析,已成为当下的热点问题之一。使用不合适的统计方法来提取含噪声复杂数据的信息,将导致有偏差的结论,但在大量数据中甄别和清洗噪声会消耗非常多的人力物力。因此,针对数据和噪声的特点来选择更加合适的学习机是必要的。其中,选择合适的损失函数来度量由复杂数据所带来的经验风险,是一种提升学习机稳定性的有效方法。本文以分类和回归问题为背景,以统计学习所导出的支持向量机为框架,以损失函数的凸性、单调性、光滑性、衍生关系等为逻辑链条,全面系统地总结了统计学习中常见的损失函数,规范了它们的数学表达与图形表示,分析对比它们的统计性质和结构。在此基础上,本文通过构造出具有特定结构的非凸损失函数框架,为损失函数引入稀疏、有界、光滑等优良性质,并由此生成了许多可为模型增强稳定性的新非凸损失函数。随后,本文通过若干数值实验,比较了本文提出的非凸损失函数和相关现存损失函数之间的表现,验证了新损失函数的优秀性能。最后,本文给出使用损失函数的一些建议,并对损失函数的前景做出了展望。
其他文献
目的:青光眼滤过手术(glaucoma filtration surgery,GFS)的失败通常归因于手术部位的瘢痕形成。人Tenon’s囊成纤维细胞(human Tenon’s fibroblasts,HTF)被认为是促纤维化反应的主要细胞类型。富含半胱氨酸的分泌型酸性蛋白(secreted protein,acidic and rich in cysteine,SPARC)被认为参与血管生成和
学位
研究目的:建立高灵敏度的川崎病丙球无反应型预测模型,结合临床指标和基因,提高临床指标的特异性。研究方法:选择2015年11月至2018年8月在上海市儿童医院就诊的330名川崎病患儿和105名门诊健康查体的儿童作为研究对象,运用电子数据库筛选出与丙球无反应相关的临床指标,以及运用靶向捕获测序技术筛查与丙球无反应相关的基因,筛查到的单核苷酸多态性(single nucleotide polymorph
学位
背景:以普拉克索为代表的D2/D3受体部分激动剂是帕金森病的常规治疗药物,其治疗帕金森病的机制为刺激黑质-纹状体部的D2和D3受体补充帕金森病引起的DA能的缺乏。一些研究发现普拉克索可能对EPS、精神分裂症的精神病性症状以及情绪障碍可能有一定疗效,但其实际疗效以及安全性还需临床检验。目的:探索D2/D3受体部分激动剂对于EPS以及精神分裂症的精神病性症状以及情绪障碍的疗效以及安全性。方法:本研究第
学位
【目的】探讨高位和低位隐睾患儿的睾丸引带在组织构成及基因表达谱的差异;探讨两组组织中细胞组分的差异及其生物学特性、研究外源性雌激素己烯雌酚对两组引带细胞的生物学特性的影响。其结果可以加深对人类睾丸下降中睾丸引带作用及外源性雌激素影响的理解。【方法】收集隐睾患儿术中废弃的睾丸引带。以麻醉下未降睾丸的位置位于内环口以上的腹腔型隐睾为高位组,以已出内环口但未出外环口的腹股沟管型隐睾为低位组,分别进行组织
学位
背景与目的弱精子症是一种以精子前向运动障碍为主要特征的男性不育疾病。其病因目前尚不明确。而正常的精子活力主要有赖于精子结构的完整;目前对精子结构及代谢如何影响其运动功能还缺乏清晰的认识。因此,深入研究精子结构及代谢对阐明弱精子症发病机制具有重要意义。本研究深入分析常见的10种哺乳动物精子的本身各超微结构、运动速度以及ATP含量之间相互关系。进一步通过分析人、小鼠、大鼠精子蛋白组学的结果,探索调控精
学位
目的:探究雄激素受体(AR)剪接变异体在PCOS患者胰岛素抵抗发生中的作用,并阐明其机制。内容:临床相关性分析、动物模型表型探究、细胞模型机制验证。方法:1)招募PCOS女性和管性不孕对照女性,采集其个人信息及内分泌数据。鉴定颗粒细胞是否存在AR剪接变异体,检测血清及卵泡液中胰岛素及雄激素相关激素水平。2)构建AR剪接变异体小鼠模型进行表型观测,包括:体重、空腹血糖、葡萄糖耐量、胰岛素耐量、体成分
学位
宫腔粘连(intrauterine adhesion,IUA)是由于多种原因引起的子宫腔、宫颈管的粘连,常常伴有纤维化的产生。患者常出现下腹疼痛、月经异常、反复流产、不孕等症状,又称为Asherman综合征(Asherman Syndrome)。对子宫内膜的损伤,例如刮宫等宫腔操作、感染等均可导致宫腔粘连的发生。因此,宫腔粘连给女性患者带来了极大痛苦,影响其生育能力。我们之前的研究发现,人羊膜上皮
学位
目的:气管相关疾病常常威胁病人的生命。气管相关疾病可由多种病因导致:肿瘤、创伤、炎症、先天性发育不良等。气管切除和重建或“端对端吻合”会增加吻合口张力,严重可导致术后气管撕裂。临床急需拥有良好力学特性和生理功能的气管支架替代物。本研究基于组织工程方法结合3D打印技术探索制备具有仿生结构的组织工程气管(TET),并构建山羊动物模型进行了原位气管移植,为组织工程气管临床应用提供实验依据。方法:我们模拟
学位
目的:(1)比较经产妇与初产妇的临床资料及妊娠结局,探究产次与不良妊娠结局之间的关系。(2)比较不同妊娠间隔(Interpregnancy interval,IPI)的经产妇的临床资料及妊娠结局,探究不同妊娠间隔与不良妊娠结局之间的关系。方法:(1)按照回顾性队列研究设计,纳入45,009例孕产妇病历资料,通过卡方检验比较初产妇与经产妇的临床资料与妊娠结局的差异,通过logistics回归分析产次
学位
肥厚型心肌病(hypertrophic cardiomyopathy,HCM)是一种常见的遗传性心血管疾病,以不能解释的心室肌肥厚、室腔变窄为特征,约占儿童原发性心肌病的20%~30%,是青少年心源性猝死最常见的病因之一。RAS/丝裂原活化蛋白激酶(RAS/mitogen-activated protein kinase,RAS/MAPK)通路组分的生殖细胞突变可致努南综合征等畸形综合征,是引起4
学位