【摘 要】
:
在线性回归分析中,如果样本中出现异常值,那么会影响回归模型的建立、参数的估计以及预测.所以,回归分析中异常值的研究一直是统计学中的热点问题.在传统的检测异常值的方法中,一般情况下估计总体参数的方法是最小二乘法,然而,最小二乘法很容易受到异常值的影响,估计出来的结果很不稳健,因此,本文在检测异常值的时候引入了总体参数的稳健估计,从而使得检测异常值更加的有效.本文基于线性回归模型,在均值漂移模型和数据
论文部分内容阅读
在线性回归分析中,如果样本中出现异常值,那么会影响回归模型的建立、参数的估计以及预测.所以,回归分析中异常值的研究一直是统计学中的热点问题.在传统的检测异常值的方法中,一般情况下估计总体参数的方法是最小二乘法,然而,最小二乘法很容易受到异常值的影响,估计出来的结果很不稳健,因此,本文在检测异常值的时候引入了总体参数的稳健估计,从而使得检测异常值更加的有效.本文基于线性回归模型,在均值漂移模型和数据删除模型的理论基础上,从残差平方和的角度出发,引入一个D统计量,并结合M估计、R估计、样本分位数法、最小中位数平方LMS估计、最小截尾平方LTS估计、最小残差尺度S估计等估计稳健的总体参数,改进D统计量,最后用改进的D统计量判断观测值是否是异常值并且估计其大小.通过有大量数据的模拟实验及真实数据的实验,比较改进的D统计量与传统检测异常值的方法.本文的主要工作内容如下:(1)研究了基于多元线性回归的一些稳健估计的方法.(2)基于数据删除模型和均值漂移模型,引入了一种检测异常值的统计量,并结合稳健估计.(3)利用R、Python等软件通过有大量数据的模拟实验及真实数据的实验,比较新的检测异常值的方法与传统检测异常值方法.结果显示,新的检测异常值的方法检测效果更好.
其他文献
本文介绍了人工智能在实时电视播控故障诊断系统中的应用,包括系统的结构,面向对象的知识表示和获取,数据库与实时数据处理,推理与解释,深层知识向浅层知识的转换等。
随着科学技术和社会经济的发展,电网布设的范围越来越复杂,用电设备越来越复杂,变压器的使用要求也在不断提升,在实际电力传输中,大型变压器也成为主要的元器件,但是大型的变
在我国部分地区,水体与土壤受重金属污染较为严重,而铅更具代表性。本论文通过大量间歇试验,较详细地研究了骨炭对多种重金属离子的吸附特性,试验结果表明,骨炭对Pb(Ⅱ)具有
植物挥发性有机化合物(biogenic volatile organic compounds, BVOCs)在近地表臭氧和二次有机气溶胶生成中有重要作用,而大气CO2浓度上升对植物BVOCs释放有显著影响。利用Meta-a
辅导员的思政工作在高职院校的各项工作中都发挥着重要的作用,所以提高高职院校辅导员的工作质量及效率十分必要。随着互联网技术的不断进步,新媒体在高职院校的广泛应用,高
随着我国经济的政策的改革和企业的飞速发展,很多大型煤炭企业的融资问题越来越严重,本文主要对目前煤炭企业的融资情况以及目前存在的问题进行简单的分析研究,并提出相应的
在分析影响课程难度的因素的基础上,构建了刻画课程难度的数学模型N=αG/T+(1-α)S/T.并以此定量比较我国《全日制义务教育数学课程标准(实验稿)》(以下简称《标准》)与《全
由于样品基质的复杂性,且样品中目标物的含量通常在微量或者痕量级别,样品前处理的成功与否在很大程度上制约着整个样品分析的速度和准确性。样品前处理的主要目的是去除基质
解题反思可以有效提升解题能力,本文运用案例分析的方法阐述了教师应精心设计解题教学,引导学生反思解题结果、解题思路、解题方法、解题规律,题目推广等,同时合理实施各项举
通过调研分析高职院校物流专业国际化人才培养状况,很多高职院校存在着国际化人才培养理念缺失,国际化人才培养目标定位不清晰,国际化人才培养的规格标准不明确等问题。应以