基于分层数据的分位数回归研究

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:zhangyongqiangis250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常生活中,人们会接触到各式各样的、来源非常多元化的数据.为了发掘与利用数据的潜在价值,需要根据数据的特点构建各式各样的统计模型.随着大数据时代的到来,数据量的增加使得诸如分层数据这样具有复杂结构的数据出现.目前关于分层数据的研究聚焦于模型的推广:从分层最小二乘回归模型到分层分位数回归模型、分层logistic回归模型.虽然,上述模型拓宽了数据的应用范围.但是仍存在一些问题如下:上述模型中的数据是完整的,没有考虑数据出现缺失这一更符合现实生活的情况;分层分位数回归模型因为分位数模型损失函数不可微的缺点,导致估计精度降低,分层分位数回归模型在惩罚参数求解过程中对两个惩罚参数分别使用不同的算法求解,致使估计的效率降低.因此,本文针对上述两个问题研究具有分层特性数据的建模问题,主要研究内容分为两部分:(1)研究响应变量随机缺失以及异方差情况下响应变量随机缺失的分层分位数回归模型的估计问题.首先采用逆概率加权方法对随机缺失的响应变量进行处理并使用LASSO惩罚函数与满足Oracle性质的ADALASSO惩罚函数进行降维处理,构建回归系数的估计,证明参数估计量的渐近性质.其次在异方差与响应变量随机缺失的假设条件下,同样证明了参数估计量的渐近性质.最后通过蒙特卡洛数值模拟与实际人体基因数据进行实例分析,结果表明所提方法表现良好.(2)基于分层分位数回归模型损失函数不可微,导致模型估计精度降低的缺点,提出分层卷积平滑分位数回归模型.首先使用核函数通过卷积方法平滑处理不可微的分位数损失函数,使之成为具有良好性质的可微凸函数.其次使用LASSO惩罚函数进行降维处理并在参数估计时,使用多步ADMM算法进行求解.同时模型的惩罚参数通过公式变换,使用CV(交叉验证)方法进行求解.最后通过数值模拟与实例分析表明:所提方法在处理具有尖峰厚尾特性数据时相较于分层分位数回归模型、分层线性回归模型更为有效;估计效率明显优于分层分位数回归模型.
其他文献
当前,我国经济已迈入新的发展阶段,经济发展重心逐渐从追求“高增速”转向追求提高经济效率和经济质量。为了培育新的经济增长引擎,亟须施行创新驱动发展战略。风险投资作为一种有效的融资选择,对培育中小企业快速成长具有重要意义,这是因为它可以为这些企业提供资本、技术、人才和管理等方面的创新要素,促进它们创新与发展。此外,风险投资对我国落实创新驱动发展战略、助推经济高质量发展发挥着积极促进作用。近年来,尽管我
学位
高质量发展是时下热点之一,二十大报告中更是将高质量发展提为首要任务。深化财税体制改革是高质量发展的重点之一。黄河流域生态环境脆弱,区域间要素差异大,传统产业改造升级滞后,内生动力不足,在如今经济发展的背景下,产业尤其是农业产业的转型发展迫在眉睫。事实和经验表明,在我国财政分权的背景下,地方政府在经济中拥有更大的决策权和自主权。本文的重点是考察财政分权与黄河流域农业高质量发展水平之间的关系。财政分权
学位
在资源稀缺和技术快速变革的今天,企业要想获得竞争优势就要提高动态能力,即在持续变化的环境中不断发现、评估和利用新机会的能力,同时,还要具有开放创新精神,即企业不仅要依靠内部创新,还要利用外部资源和能力来实现创新。公司创业投资(Corporate Venture Capital,简称CVC)作为企业提升动态能力和开放创新的有效工具,受到越来越多企业的关注。众多企业在战略目标的驱动下设立CVC投资部或
学位
国际贸易体系的深化使全球价值链延伸到产品生产链的许多环节,全球价值链越来越多地参与到中国的经济发展中,由此带来的资源消耗和环境破坏也亟待关注。碳排放特别是二氧化碳排放问题,涉及到全球经济、社会、生态和政治等多个领域,与碳排放相关的资源和环境问题也促使各国收紧碳排放政策。2022年,“双碳”目标第二次被列入政府工作报告,延续了上一次报告中强调的“先立后破”的碳减排方式,重点是双碳减排工作。《巴黎协定
学位
近年来,随着经济全球化和区域一体化的不断深入,国际国内市场竞争不断加剧,产业转移不仅是世界经济发展的主要特征,也是我国广泛参与世界经济的迫切需要。但我国东中西部地区发展各异,东部地区社会成本巨大,中西部地区存在着生态环境脆弱,资源环境供给不足等诸多问题。因此本文旨在研究我国城市承接产业转移示范区对绿色发展效率的影响路径,从而为我国实现经济发展和生态环境的“双赢”提供理论基础。文章首先分析了承接产业
学位
自工业革命以来,人类科学技术得到了突飞猛进的发展,随着科技的进步,人类生产、生活方式也产生了翻天覆地的变化,随之而来的是对各种自然资源的需求与日俱增,亟待一种新的可持续发展模式来解决人类社会与自然环境之间的冲突。我国拥有着约九百六十万平方公里的国土面积,幅员辽阔,包含多种地势地貌,拥有着丰富的自然资源,各省应当主动探索切合自身实际情况的可持续发展战略。如何在发展过程中及时评估现状,进一步提高政府的
学位
习近平总书记从提出绿水青山就是金山银山在到要在2060年实现“双碳”目标,彰显大国担当。作为世界上能源最大的能源消费和生产国,我国碳市场已经取得了跨越式进展,2010年到2021年,从首次提出建设碳市场到全国碳市场开市交易,意味着我国低碳发展已经取得阶段性胜利,为实现新能源转型取得了更为广阔的市场,基于此,深入挖掘研究碳排放权交易价格(以下简称碳交易价格)的影响因素以及内在机理对预测碳交易价格帮助
学位
Cox比例风险模型在生存分析中扮演着重要的角色,它能够利用风险函数研究变量与生存函数间的关系,初步处理存在删失情况的生存数据,但实际生活中的数据通常不满足Cox比例风险假定。针对这类数据,引入部分线性可加Cox模型,实现对时依协变量的变量选择研究。本文主要研究内容分为以下三部分:(1)通过B-样条曲线拟合部分线性可加Cox模型中的非参数部分,将模型中未知分量函数选择问题转变为处理线性组合中选择系数
学位
近年来,贸易保护主义抬头,逆全球化势头高涨,新冠疫情的冲击挥之不去,全球经济不稳定不确定性明显增强。从国内环境看,中国正处于经济增速换挡期、结构调整阵痛期、前期刺激政策消化期三期叠加的阶段,改革发展稳定任务艰巨。面对当前中国经济发展的新环境和新阶段,双循环新发展格局应运而生。2020年5月14日,中央提出“深化供给侧结构性改革,充分发挥我国超大规模市场优势和内需潜力,构建国内国际双循环相互促进的新
学位
学位