Huber矩阵回归理论与算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户：cjwmyzl

【摘要】

：

【作者】

：

陈丙振

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2019年01期

【关键词】

：

Huber矩阵回归

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来，我们面临的数据越来越复杂.矩阵形式的数据普遍存在于科学研究和实际应用领域中，如基因表达分析、脑神经网络、金融、经济、机器学习与人工智能、医学影像疾病诊疗、风险管理等.目前对于这些数据的处理，大多基于同方差假设并利用最小二乘模型进行统计分析.事实上，很多数据不是同方差的.此时最小二乘模型不能很好地解释这些数据.在这种情况下，很自然地我们要考虑稳健方法，如分位数回归.但是在实际问题中，我们不清楚数据是否重尾或含有离群点.这时，考虑使用Huber函数作为损失函数是一个很好的选择．Huber函数是二次函数和绝对值函数的组合，是绝对值函数的光滑化函数.从优化角度看，光滑化更有利于优化算法的设计.此外，数据中还存在结构特征，如元素稀疏、预测变量稀疏、低秩、多重共线性等.本文通过正则化技术，建立Huber矩阵回归模型.然后，我们研究了模型的统计性质并设计了模型的求解算法.最后，我们利用这些模型对模拟数据和真实数据进行了分析.
　　对于低秩的重尾矩阵数据，我们建立了核范数正则化Huber矩阵回归模型.借助于核范数的可分解性，Huber损失函数的局部限制强凸性和近似低秩性等概念，给出了模型估计的风险上界.然后设计了迭代复杂度为O(√Lf／ε)的加速邻近梯度算法mAPG来估计模型的系数矩阵.最后，我们使用此模型对模拟数据和Norwegian纸张质量数据进行分析.结果表明，核范数正则化Huber矩阵回归模型能给出更好的结果.
　　对于存在多重共线性且低秩的重尾矩阵数据，我们建立了低秩弹性网正则化Huber矩阵回归模型，并从理论上证明了此模型的组性质.在关于噪声和设计矩阵的一些条件下，建立了其解的风险上界.在第二章提出的mAPG算法的基础上，考虑了连续技术和截断技术来进一步加速mAPG算法.通过分析模拟数据和拟南芥数据，我们发现，低秩弹性网正则化Huber矩阵回归模型能很好地处理重尾数据中的共线性问题.
　　对于存在多重共线性且预测变量稀疏的重尾矩阵数据，我们建立了行稀疏弹性网弹性网正则化Huber矩阵回归模型，并在理论上证明了其组性质.在一些假设条件下，我们建立了其风险上界，此外，设计了迭代复杂度为O(√Lf／ε)的加速邻近次梯度算法来求解此模型.通过进行模拟试验和分析聚乙烯数据集，我们发现，行稀疏弹性网正则化Huber矩阵回归模型不仅能很好地处理重尾数据中的共线性问题，还可以选择出重要的预测变量.
　　总之，我们针对具有不同结构特征的矩阵回归问题，提出了正则化Huber矩阵回归模型，研究了模型的统计性质，设计了有效的优化算法并给出了收敛性分析，通过数值实验验证了模型的有效性和理论性质.

其他文献

A企业EPC招标管理研究

随着现代社会的发展和科技的进步，生产力的竞争越来越大。A企业原是传统形式的工业设计院，现过渡转型为以钢铁冶炼相关设计为核心，以工程总承包（EPC）盈利模式为主的公司。EPC指的是在业主委托的基础上根据合同约定承包工程建设项目的设计、采购和施工等全部或几个过程。招标管理可以有效降低企业成本，提升利润，特别是对A企业的设备采购而言。从招标过程来看，承包商与供应商是一种博弈，不同的供应商之间更是一种博弈

学位

钢铁企业

“互联网+”背景下A翻译企业转型战略研究

随着“互联网+”和AI的快速发展，对许多企业带来了巨大的影响，翻译行业也同样不例外，固守的经营方式只能让企业逐渐从市场竞争中败下来，随着大型翻译企业通过大数据对翻译行业的洗牌，翻译企业如果不发展，固步自封，就会被市场淘汰。世界全球化和国际化进程也在不断加速，尤其是随着我国“一带一路”和“中国企业走出去”战略的深入推进，企业为维护其竞争优势，必须持续根据内外部环境的变化对其发展战略做出适时改变。基于

学位

翻译企业

H影业公司发展战略研究

在电影市场竞争日益激烈和产业政策不断出台的大环境下，中国影视行业正经历着行业大洗牌的时期，市场格局不断发生变化，产业环境并不稳定，移动互联网的普及给中小电影公司创造了更多逆袭的机会。本文首先对H影业公司所处的行业环境、外部环境、竞争对手及战略群组的分析其所处的外部环境进行剖析，明确H影业公司在市场中的定位，其定位不同于大型电影公司的横向全产业链模式，而是以满足用户需求为导向来寻求自身定位，这样的定

学位

影视企业

资管新规下私募投资机构商业模式的转换路径分析

资产管理行业自2018年进入强监管常态化的元年，随着《关于规范金融机构资产管理业务的指导意见》（简称“资管新规”）、《私募投资基金管理暂行条例》适时出台，以及相应监管配套实施细则落地、自查摸排和监管的现场及非现场检查，使得整个行业尤其是私募投资机构面临的监管日趋严格，业务开展形势愈加严峻。在复杂的国内外金融环境下，探索新的业务模式进行转型和升级，回归本源，在科学的管理体系中适应新的“游戏规则”，是

学位

私募投资机构

B公司第三方物流服务质量评价研究

近年来汽车市场竞争激烈，行业变革势在必行，物流已成为企业的第三利润源，为降低物流成本，企业采用第三方物流外包模式，将车企的仓储、运输、包装业务外包给第三方运营。为提升第三方物流服务质量，提高客户满意度的同时增强企业自身的信誉和竞争力，必须及时对第三方物流服务质量做出评价，完善评价指标体系，并监督、管理、改善物流服务质量。　　本论文以B公司第三方物流服务质量评价为研究对象，首先对国内外服务质量及第三

学位

汽车企业

企业内部控制报告缺陷披露对权益资本成本的影响研究--基于我国上市公司2014--2018年经验证据

我国内部控制相关要求规定，企业应定期组织内部控制自我评价并对外披露相关报告。上市公司通过披露内部控制自我评价报告，可以向资本市场提供企业管理机制、运行的效率效果等信息，树立企业形象。那么内部控制报告中所披露的内部控制缺陷，是否会向投资者传递了消极的信号，使投资者担心因上市公司经营不利导致面临更大的投资风险，进而提高预期投资回报率，使企业权益资本成本上升？本文对企业内部控制报告缺陷披露对权益资本成本

学位

上市公司

淘宝直播KOL对消费者购买意愿的影响研究

随着网络信息的不断发展和完善，网络信息对人们的日常生活产生着越来越重要深远的影响。2016年被称为“网络直播元年”。根据淘宝微博账号官方数据发布，从2016年5月淘宝直播开始运营，短短一个月就实现了注册用户破万的记录；到了2017年，中国网络直播用户规模接近4.5亿，并且以每年22.6%的增速迅速增长；2018年时，淘宝直播带货已经突破1000亿，增速400%，有81位主播年收入过亿；根据淘宝直播

学位

电商平台

五粮液集团白酒业务的竞争战略研究

本文从五粮液集团的现状出发，在面对白酒业全行业竞争加剧的情况，以基本竞争战略理论为框架，对五粮液集团的竞争战略进行研究。通过一系列分析，最终确认了五粮液集团的最优竞争战略。并且在应对市场竞争方面，提出了顺势而为，重塑企业定位，转变的新思路，对同类企业具有一定的参考价值。　　为了提高公司竞争战略制定的科学性和有效性，本文在研究过程中采用了多种先进的的战略管理模型和方法，采用PEST的分析法对宏观环境

学位

白酒企业

不同地域条件下村庄空心化特征评价及驱动机制研究--以南阳市典型村庄为例

村庄空心化现象给农村地区健康有序发展带来了不可忽视的负效应，探讨不同地形条件（平原、丘陵、山地）和区位条件（近郊、远郊）下的村庄空心化特征、驱动机制等对于我国有效实行“乡村振兴”战略、“精准扶贫”政策等具有一定意义。本研究构建空心村庄现状特征评价理论框架，选取不同地域条件下的6个典型村庄进行实地调研，对其现状特征差异进行实证分析;并从总体性和个体性两个角度对比分析空心化驱动机制，提出相应的整治建议

学位

村庄空心化

基于互联网大数据和引力模型的村庄分类方法研究--以河南省叶县为例

一直以来，农业农村作为我国现代化发展的稳定器、蓄水池，为国家事业全面开创新局面提供了强有力的支撑。但是，我国农村经济社会发展阶段性矛盾突出，农村现代化建设依然薄弱。近年来，在我国多元化的城镇化过程中，乡村发展分化现象明显。为此，《乡村振兴战略规划(2018-2022年)》中特提出“强化规划引领、注重分类施策”的工作要求。2019年1月，中央农办、农业农村部、自然资源部等五部委联合发布《关于统筹推进

学位

乡村规划

Huber矩阵回归理论与算法研究

与本文相关的学术论文