论文部分内容阅读
在统计分析中,我们常常需要知道当变量X改变时,变量Y是如何改变的,这就是回归分析,变量X和变量y的关系可以表示为Y=m(X)+ε
其中,m被称为回归函数,ε是误差,我们常常通过抽样,得到包含了回归函数m的信息的数据(Y1,X1),(Y2,X2),…,(Yn,Xn),从而可以通过这些数据来推测m.
统计学中经常用到的回归方法是参数方法,例如,线性回归模型就是一个简单的参数模型.参数估计方法假设回归函数具有己知的结构,从而对回归函数中的参数进行估计,即可得到回归函数的估计.如果假设的回归函数模型是正确的,则使用参数估计方法进行估计是十分有效的.
但是,如果假设的回归函数模型不正确,则回归函数的估计将会有很大的偏差,而如果使用非参数估计方法,这个问题就不会存在.
如果我们几乎不知道关于回归函数m的信息,则应该使用非参数估计方法.非参数方法对于回归函数的结构仅有最小的要求,即“非参数方法让数据自己决定回归函数”.为了进行非参数估计,我们仅需要回归函数m具有一定的光滑性.因此,非参数估计方法是一种应用非常广泛的统计学估计方法.
一个典型的统计推断过程包括五个步骤——假定总体分布族、抽取样本、计算统计量及抽样分布、假设检验和模型评估.假定总体分布族是对实际问题的数学描述,它是统计推断的基础,统计方法的估计效果很大程度上依赖于数学模型的假设.经过多年的发展与完善,参数统计已经发展的日渐完善,但是在有些问题中参数统计也显现出其弊端.非参数统计(Nonparametric statistics)如今在统计学中占有越来越重要的地位,其应用也已经逐渐渗透到社会的各个方面,比如经济学和医学的各个领域,它的发展是一个不可阻挡的趋势.
非参数统计有各种方法,本文首先比较了两种常用非参数估计——Nadaraya-Watson核估计和局部线性估计的优缺点,然后结合它们的优点提出了加权Nadaraya-Watson核估计.而对于一个估计量而言,估计量的相合性是大样本理论中首位的、讨论最多、最受重视的一个问题,因而本文分别在负相伴(Negative associated)和(-ρ)混合条件下,对加权Nadaraya-Watson回归估计的性质进行讨论,并在适当的条件下,证明了估计量的相合性和渐近无偏性.
文章主要由以下几部分构成:第1章介绍研究的背景和意义,以及相关文献的综述;第2章介绍各种非参数估计——Nadaraya-Watson核估计和局部线性估计,结合它们的优点提出了加权Nadaraya-Watson估计;第3章研究负相伴下加权Nadaraya-Watson估计的性质,在适当的条件下证明了该估计量的弱相合性和渐近无偏性;第4章研究(-ρ)混合下加权Nadaraya-Watson估计的性质,在适当的条件下证明了该估计量的弱相合性和渐近无偏性.