Huber矩阵回归理论与算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:cjwmyzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,我们面临的数据越来越复杂.矩阵形式的数据普遍存在于科学研究和实际应用领域中,如基因表达分析、脑神经网络、金融、经济、机器学习与人工智能、医学影像疾病诊疗、风险管理等.目前对于这些数据的处理,大多基于同方差假设并利用最小二乘模型进行统计分析.事实上,很多数据不是同方差的.此时最小二乘模型不能很好地解释这些数据.在这种情况下,很自然地我们要考虑稳健方法,如分位数回归.但是在实际问题中,我们不清楚数据是否重尾或含有离群点.这时,考虑使用Huber函数作为损失函数是一个很好的选择.Huber函数是二次函数和绝对值函数的组合,是绝对值函数的光滑化函数.从优化角度看,光滑化更有利于优化算法的设计.此外,数据中还存在结构特征,如元素稀疏、预测变量稀疏、低秩、多重共线性等.本文通过正则化技术,建立Huber矩阵回归模型.然后,我们研究了模型的统计性质并设计了模型的求解算法.最后,我们利用这些模型对模拟数据和真实数据进行了分析.
  对于低秩的重尾矩阵数据,我们建立了核范数正则化Huber矩阵回归模型.借助于核范数的可分解性,Huber损失函数的局部限制强凸性和近似低秩性等概念,给出了模型估计的风险上界.然后设计了迭代复杂度为O(√Lf/ε)的加速邻近梯度算法mAPG来估计模型的系数矩阵.最后,我们使用此模型对模拟数据和Norwegian纸张质量数据进行分析.结果表明,核范数正则化Huber矩阵回归模型能给出更好的结果.
  对于存在多重共线性且低秩的重尾矩阵数据,我们建立了低秩弹性网正则化Huber矩阵回归模型,并从理论上证明了此模型的组性质.在关于噪声和设计矩阵的一些条件下,建立了其解的风险上界.在第二章提出的mAPG算法的基础上,考虑了连续技术和截断技术来进一步加速mAPG算法.通过分析模拟数据和拟南芥数据,我们发现,低秩弹性网正则化Huber矩阵回归模型能很好地处理重尾数据中的共线性问题.
  对于存在多重共线性且预测变量稀疏的重尾矩阵数据,我们建立了行稀疏弹性网弹性网正则化Huber矩阵回归模型,并在理论上证明了其组性质.在一些假设条件下,我们建立了其风险上界,此外,设计了迭代复杂度为O(√Lf/ε)的加速邻近次梯度算法来求解此模型.通过进行模拟试验和分析聚乙烯数据集,我们发现,行稀疏弹性网正则化Huber矩阵回归模型不仅能很好地处理重尾数据中的共线性问题,还可以选择出重要的预测变量.
  总之,我们针对具有不同结构特征的矩阵回归问题,提出了正则化Huber矩阵回归模型,研究了模型的统计性质,设计了有效的优化算法并给出了收敛性分析,通过数值实验验证了模型的有效性和理论性质.
其他文献
随着现代社会的发展和科技的进步,生产力的竞争越来越大。A企业原是传统形式的工业设计院,现过渡转型为以钢铁冶炼相关设计为核心,以工程总承包(EPC)盈利模式为主的公司。EPC指的是在业主委托的基础上根据合同约定承包工程建设项目的设计、采购和施工等全部或几个过程。招标管理可以有效降低企业成本,提升利润,特别是对A企业的设备采购而言。从招标过程来看,承包商与供应商是一种博弈,不同的供应商之间更是一种博弈
学位
随着“互联网+”和AI的快速发展,对许多企业带来了巨大的影响,翻译行业也同样不例外,固守的经营方式只能让企业逐渐从市场竞争中败下来,随着大型翻译企业通过大数据对翻译行业的洗牌,翻译企业如果不发展,固步自封,就会被市场淘汰。世界全球化和国际化进程也在不断加速,尤其是随着我国“一带一路”和“中国企业走出去”战略的深入推进,企业为维护其竞争优势,必须持续根据内外部环境的变化对其发展战略做出适时改变。基于
学位
在电影市场竞争日益激烈和产业政策不断出台的大环境下,中国影视行业正经历着行业大洗牌的时期,市场格局不断发生变化,产业环境并不稳定,移动互联网的普及给中小电影公司创造了更多逆袭的机会。本文首先对H影业公司所处的行业环境、外部环境、竞争对手及战略群组的分析其所处的外部环境进行剖析,明确H影业公司在市场中的定位,其定位不同于大型电影公司的横向全产业链模式,而是以满足用户需求为导向来寻求自身定位,这样的定
学位
资产管理行业自2018年进入强监管常态化的元年,随着《关于规范金融机构资产管理业务的指导意见》(简称“资管新规”)、《私募投资基金管理暂行条例》适时出台,以及相应监管配套实施细则落地、自查摸排和监管的现场及非现场检查,使得整个行业尤其是私募投资机构面临的监管日趋严格,业务开展形势愈加严峻。在复杂的国内外金融环境下,探索新的业务模式进行转型和升级,回归本源,在科学的管理体系中适应新的“游戏规则”,是
近年来汽车市场竞争激烈,行业变革势在必行,物流已成为企业的第三利润源,为降低物流成本,企业采用第三方物流外包模式,将车企的仓储、运输、包装业务外包给第三方运营。为提升第三方物流服务质量,提高客户满意度的同时增强企业自身的信誉和竞争力,必须及时对第三方物流服务质量做出评价,完善评价指标体系,并监督、管理、改善物流服务质量。  本论文以B公司第三方物流服务质量评价为研究对象,首先对国内外服务质量及第三
学位
我国内部控制相关要求规定,企业应定期组织内部控制自我评价并对外披露相关报告。上市公司通过披露内部控制自我评价报告,可以向资本市场提供企业管理机制、运行的效率效果等信息,树立企业形象。那么内部控制报告中所披露的内部控制缺陷,是否会向投资者传递了消极的信号,使投资者担心因上市公司经营不利导致面临更大的投资风险,进而提高预期投资回报率,使企业权益资本成本上升?本文对企业内部控制报告缺陷披露对权益资本成本
学位
随着网络信息的不断发展和完善,网络信息对人们的日常生活产生着越来越重要深远的影响。2016年被称为“网络直播元年”。根据淘宝微博账号官方数据发布,从2016年5月淘宝直播开始运营,短短一个月就实现了注册用户破万的记录;到了2017年,中国网络直播用户规模接近4.5亿,并且以每年22.6%的增速迅速增长;2018年时,淘宝直播带货已经突破1000亿,增速400%,有81位主播年收入过亿;根据淘宝直播
学位
本文从五粮液集团的现状出发,在面对白酒业全行业竞争加剧的情况,以基本竞争战略理论为框架,对五粮液集团的竞争战略进行研究。通过一系列分析,最终确认了五粮液集团的最优竞争战略。并且在应对市场竞争方面,提出了顺势而为,重塑企业定位,转变的新思路,对同类企业具有一定的参考价值。  为了提高公司竞争战略制定的科学性和有效性,本文在研究过程中采用了多种先进的的战略管理模型和方法,采用PEST的分析法对宏观环境
学位
村庄空心化现象给农村地区健康有序发展带来了不可忽视的负效应,探讨不同地形条件(平原、丘陵、山地)和区位条件(近郊、远郊)下的村庄空心化特征、驱动机制等对于我国有效实行“乡村振兴”战略、“精准扶贫”政策等具有一定意义。本研究构建空心村庄现状特征评价理论框架,选取不同地域条件下的6个典型村庄进行实地调研,对其现状特征差异进行实证分析;并从总体性和个体性两个角度对比分析空心化驱动机制,提出相应的整治建议
一直以来,农业农村作为我国现代化发展的稳定器、蓄水池,为国家事业全面开创新局面提供了强有力的支撑。但是,我国农村经济社会发展阶段性矛盾突出,农村现代化建设依然薄弱。近年来,在我国多元化的城镇化过程中,乡村发展分化现象明显。为此,《乡村振兴战略规划(2018-2022年)》中特提出“强化规划引领、注重分类施策”的工作要求。2019年1月,中央农办、农业农村部、自然资源部等五部委联合发布《关于统筹推进
学位