【摘 要】
:
随着第四次工业革命的到来,处理海量高维复杂数据逐渐成为科技工作者的工作常态。尤其是在诸如基因工程、互联网等高新技术产业,所需处理数据特征维度的数量级往往能够达到百万乃至上亿规模。这种规模的数据集对数据储存、数据建模运算带来相当大的挑战。同时,传统分析方法在分析处理该类数据时,存在一定局限性。但基于这类数据就具体问题进行建模分析时,真正涉及到的特征维度通常是远低于数据集本身的特征维度,即大部分特征维
论文部分内容阅读
随着第四次工业革命的到来,处理海量高维复杂数据逐渐成为科技工作者的工作常态。尤其是在诸如基因工程、互联网等高新技术产业,所需处理数据特征维度的数量级往往能够达到百万乃至上亿规模。这种规模的数据集对数据储存、数据建模运算带来相当大的挑战。同时,传统分析方法在分析处理该类数据时,存在一定局限性。但基于这类数据就具体问题进行建模分析时,真正涉及到的特征维度通常是远低于数据集本身的特征维度,即大部分特征维度都是冗余的。我们从这些高维复杂数据的特征中筛选出我们需要的特征,这就是稀疏学习。在大数据时代背景下,稀疏学习在压缩感知、统计学习理论等领域的作用日渐凸显。常见的稀疏学习可以从l0范数稀疏学习问题,对l0范数松弛化后的稀疏学习问题以及贝叶斯角度下的稀疏学习问题等方面入手。本文基于贝叶斯理论框架,对线性模型稀疏学习问题进行研究。与其他诸多利用贝叶斯方法研究线性模型稀疏学习问题不同,本文是在系数向量的支撑上定义稀疏先验分布。该稀疏先验分布中包含系数向量的l0范数信息,系数向量的支撑在本文的贝叶斯框架下尽可能地收缩,从而达到稀疏学习的目的。本文从理论上证明了这种先验分布定义方式具有良好的理论性质。首先,我们推导得到关于系数向量最大后验估计与后验期望估计的Oracle不等式,在满足一定条件下,其预测估计误差是依概率收敛的。其次,本文给出关于支撑的最大后验估计的后验一致性结论,使得后验概率达到最大的支撑?J依概率收敛到真实系数向量对应的支撑J?。再者,本文给出关于系数向量贝叶斯估计的误差边界,其理论结果表明估计误差能够得到较好控制。本文还利用马尔科夫链蒙特卡罗法构建贝叶斯稀疏学习求解算法。最后,利用数值模拟验证本文所提方法的有效性。
其他文献
涡轮冲压组合发动机(TBCC)以其单位推力大、飞行包线宽和可重复使用等优势,成为当前最有发展前途的高超声速动力装置之一,多模态燃烧室作为其主要部件,面临工作范围宽、流动
随着全球化、信息化时代与知识社会的来临,社会竞争越来越激烈,传统的校内书本知识的教育已无法满足当今中学生的成长需求以及社会对未来人才的要求。自2013年国务院发布《国民休闲旅游纲要》,首次提出要推行中小学研学旅行活动后,在政府及社会各界的大力推动下,研学旅行成为了近几年的热点研究课题。丰富的研学旅行课程资源是开展研学旅行活动的重要保障。延边地区地理研学旅行课程资源丰富,有效开发该区域地理研学旅行课
三维编织复合材料作为新型材料应用于航空发动机风扇叶片,航空发动机在服役期间经历飞行,停放等不同干湿度交替循环过程,必然会带来复合材料的湿热老化。且航空发动机风扇叶
本论文用纳米复合材料(ZnO NWs/SiO2)为载体,阴离子双环氧化合物为交联剂,采用原位交联法固定过氧化物酶(包括氯过氧化物酶和辣根过氧化物酶)。将所得到的纳米生物催化剂应用于催
随着网络技术的日益普及以及分布式系统对高精度、高稳定时间基准需求的逐渐提高,如何满足系统内各终端设备对时间基准的需求显得尤为重要。利用网络时钟同步技术对终端设备进行时钟同步是主流研究方法之一,该技术通过标准时钟参考源来校正系统中终端设备的时间,以满足各单元对时钟的需求。NTP(Network Time Protocol网络时间协议)是一种专门用来对网络系统做时间同步化的协议,网络时钟同步技术利用N
汽车穿越中央分隔带护栏驶向对向车道的事故常有发生,现有中央分隔带护栏表现出抗撞强度不足的现象。我国中央分隔带一般较窄,中央分隔带护栏变形过大易引发二次碰撞事故。为增强中央分隔带护栏抗撞强度,减小护栏变形量,提出一种新型中央分隔带组合式护栏。这种护栏由加筋混凝土结构和波形梁结构组成。然而,护栏初始设计结构安全性能存在不足,并且在设计过程中会受到不确定因素的影响。因此,需进一步对护栏结构进行优化。本文
本文对常用保温材料和保温结构的性能特点进行了对比,并对保温改造所参考的技术标准与保温工程实际所存在的差异进行了研究,提出了符合企业实际需要的改造方案,对企业保温改
改革开放四十余年以来,我国服务业实现了高速发展,在总量和比重上都得到了飞速的提升,具体表现为,服务业产值总量由888.8亿元增加到432954.4亿元,40年的时间增长了将近486倍,服务业占国内生产总值的比重由24.5%提升到52.2%。现如今,中国经济发展在进入新常态以来,发展阶段的特征从高速增长转变为高质量发展,产业结构逐渐呈现出服务经济化的特点。而在区域经济发展的进程中,老龄化程度逐步加深
生态安全是人类赖以为生的基本条件,同时也是经济社会持续发展的重要基础。生态安全综合评价问题是生态安全研究内容的重点,也是国家、政府制定相关生态保护政策和发展规划的
目前我国机动车达到3.1亿辆,废旧轮胎产量也位居全球第一,并且每年以8%-1 0%的数量急剧增长。我国公路主要以沥青路面为主,随着交通量的不断增大,重载超载问题日趋严重,路面缺陷也逐渐暴露出来,这使我国沥青路面面临着重大挑战。废旧轮胎产量的不断增大造成了环境的严重污染,使生态环境也面临着严峻的挑战。针对这两大挑战,国内外研究学者提出将废旧轮胎热解炭黑作为沥青的改性剂,不但可以改善沥青的性能,还可以