回归模型的估计方法及在林业中的应用研究

被引量 : 20次 | 上传用户:dianquan999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计分析是使林业科学结论定量化的重要工具之一。在林业科学研究中,人们大量应用着各种统计分析手段,然而,林业中统计分析方法的正确应用却一直是倍受关注的问题。本文就林业中模型的估计方法存在的部分问题进行深入的研究,为林业统计建模提供更多科学而有效的方法。文章主要研究模型中的共线性问题、异方差问题、度量误差问题和联立方程组模型估计问题。1.论文第三章中以思茅松多元树高模型为对象,采用200株思茅松数据,研究了模型中的共线性问题。在使用常规的逐步回归估计后,自变量由原来的9个缩减到4个,但模型中的共线性并没有得到消除。普通最小二乘法回归和基于普通最小二乘法的逐步回归是不能消除模型中的多重共线性的。逐步回归只是对变量进行筛选,删除对树高影响不显著的解释变量。论文再通过相关系数矩阵分析法,条件指数、容限度、方差膨胀因子判定法,通径分析法对共线性进行了深入分析,证实模型中的确存在着较强的多重共线性,其方差膨胀因子有两项大于10。文章通过岭回归,主成份回归和偏最小二乘法三种方法分别对多重共线性的多元线性树高模型进行估计。三种方法都能消除该模型中的多重共线性,其参数估计结果各不相同。为对比三种方法消除共线性的有效性,文章使用方差膨胀因子指标进行对比分析。分析结果说明岭回归在消除共线性上是非常有效的。相对主成份回归和偏最小二乘回归而言,岭回归会对模型中的其它解释变量进行综合调整,并且不会丢失模型中的信息。应用方差膨胀因子判定k值的方法,使得岭回归的使用也并不太难。根据方差膨胀因子结果判定,本文中的思茅松多元树高模型使用岭回归时,k值应取0.1370。主成份回归和偏最小二乘回归方法采用同一统计原理,只对产生共线性的数据部分进行处理。但由于信息量的丢失,可能会对共线性处理过度而造成回归系数出现偏差。在林业统计建模中应根据不同的条件选择不同的方法,本论文认为岭回归对于思茅松多元树高模型中共线性的消除最为有效,合理。2.论文第四章分别对思茅松树高曲线中的异方差和落叶松材积模型中的异方差进行了研究。前者为线性模型,后者为非线性模型,对于林业中模型的异方差性研究具有一定的代表性。文章通过异方差的检验证实模型中存在异方差性。林业中的观测数据因测量主体及方法的不同,异方差性的存在在所难免,只是强弱程度有所不同。在前人的研究基础上,文章分别使用了12种定式权函数及4种非定式权函数对思茅松树高曲线方程中的异方差性进行研究;同时采用了8种权函数形式对落叶松材积模型中的异方差性开展研究。对于思茅松树高曲线中的异方差消除,选择1/x2.334为权函数效果最好;对于落叶松材积模型中的异方差消除,选择1/D2H为权函数效果最好。通过加权回归估计消除异方差的方法,进一步验证了不同的模型具有不同的最优权函数形式的理论。在消除异方差时应试验多种权函数形式进行对比选优。在权函数的构造中,不能只是使用定式权函数形式,虽然同样也可以消除模型中的异方差性,但结果比较粗糙,不符合精细化的要求。如果模型在精度上有所要求,在权函数的选择上应该使用非定式权函数的方法。在异方差表现为线性结构时,非定式权函数中r的取值是受模型数据中的异方差性的强弱影响的,相同的模型不同的异方差性,其r值就不同。模型中异方差性越强,r就越远离0值;异方差性越弱,r就越接近0值,其权函数就越接近于1,越近似于最小二乘法。当异方差性是线性减小,即方差的线性斜率为负时,r取正值;减小幅度越大即斜率越小,r值就越大。当异方差性是线性增大,即方差的线性斜率为正时,r取负值;增大幅度越大即斜率越大,r值就越小。3.论文第五章研究了度量误差对于材积模型V = aDb的影响并使用度量误差模型方法对模型进行了参数估计,其结论是:当自变量无度量误差,因变量存在度量误差时,随着因变量度量误差方差的不断增大,模型参数的估计值波动是很大的,有着越来越不稳定的趋势。因变量的度量误差对模型参数的估计值是有影响的,使用通常的非线性回归方法对材积模型进行估计不会是最优的估计方法。当自变量存在度量误差,因变量没有误差时,随着自变量的度量误差方差不断增大,参数的估计值波动同样增大,也有着越来越不稳定的趋势;同时参数的估计值有着减小的趋势。自变量的度量误差同样对模型是有影响的。在通常的非线性回归方法中,我们假设自变量没有误差;或者其误差是无关紧要的,对模型是没有影响的做法是不恰当的。和林业中的其它观测数据一样,材积模型中自变量和因变量都是通过不同的测量工具和方法观测得到的,其中必然就存在度量误差。因变量和自变量都带有度量误差的模型参数估计是一个复杂的问题。通常的非线性回归方法都是假定自变量是没有误差的,这就不能简单地采用通常的非线性回归估计方法来估计材积模型。使用度量误差模型方法来估计材积模型,这是符合材积模型中因变量和自变量都有度量误差的实际情况。使用常规方法,材积V的残差平方和为0.5678,使用度量误差模型方法,材积V的残差平方和为0.4450。其估计结果使模型残差平方和变得更小,更符合方差最小的统计原则。当被解释变量所含的度量误差比较大时,常规参数估计方法使得估计参数既不是无偏的,也不是相合的估计量。而采用线性度量误差方法就可以得到无偏估计,只要误差矩阵估计得比较正确。该方法为带有度量误差的材积模型参数估计提供一个符合实际情况的更加有效的方法。4.在第六章中,文章以兴安落叶松为例,讨论了联立方程组模型在建立二元立木材积模型中的应用,以及二步估计在解联立方程组模型中的优越性,取得了良好的效果。本文初次使用了联立方程组模型方法来建立二元立木材积模型,该方法符合二元立木材积模型的建模原则。二元立木材积模型中,树高使用树高曲线方程中估计的平均树高,在联立方程组模型中可直接实现,不需要按传统方法分步进行估计。并且,该方法使同一树种的树高曲线方程与材积模型具有相容性。在联立方程组模型的求解中,本文使用在林业中较少使用的二步估计方法。在二步估计中,总相对误差RS=-0.1737,平均相对误差E=-2.6279,相对于普通非线性估计中的RS=-0.4615,E=-4.1514,其值更接近于0点。证实二步估计方法在参数估计中,不仅可以使参数估计具有无偏性,而且还能减少系统误差,该方法在解联立方程组模型中优于普通非线性估计。文中的联立方程组模型及二步估计方法在求解二元立木材积模型具有一定的优越性。其方法具有简洁易操作性,并且估计结果优于传统方法。
其他文献
松辽盆地南部不仅是重要的油气成藏区,也是砂岩型铀矿富集成矿区。本文在综合研究钻井、地震及其它地质资料的基础上,运用砂岩型铀成矿理论及层序地层、沉积体系分析方法,结
冷战结束后,全球范围内爆发战争的可能性大大降低的同时,地区矛盾和冲突成为国际政治中主要的战争表现形态,东北亚地区安全形态是世界安全形态的一个重要的组成部分,对亚太地
随着经济全球化和市场竞争激烈程度的加剧,通过扩大生产能力、降低生产成本来增加利润的“第一利润源”和通过提高劳动生产力、降低人力消耗或采用机械化、自动化来降低劳动
通信企业客户关系管理(CRM)是一个热门话题,因为在中国第三次电信运营商重组后,形成了三家拥有全国性网络资源、实力与规模相对接近、具有全业务经营能力和较强竞争力的市场
动漫产业是当今中国发展的一大热潮,杭州是这个热潮的一个重要的组成部分,并且因为杭州国际动漫节而获得了更为广泛的关注。尽管动漫产业被寄予了极大的厚望,但是在动漫产业
在现代社会,大众媒介的影响力已经渗透到了人类生活的方方面面,它们的作用除了告知受众信息之外,还有一个非常重要的作用——使受众通过对大众传播媒介的体验,在获取信息与知
理中丸是张仲景治疗脾阳虚证的传统名方,由干姜、人参、白术、炙甘草四味药组成,功能温中散寒,补气健脾。干姜作为理中丸的君药,在全方的配伍结构中处于核心地位,在对脾胃虚
排土场安全问题不仅直接关系到矿山的安全生产,还涉及到周边环境的安全及附近居民的安危。然而对于那些工程地质条件差的排土场而言,其保证排土场安全的难度增大,然而排弃物
近代著名学者陈寅恪先生曾经说:“华夏民族之文化,历数千载之演进,造极于赵宋之世”。宋代的统一结束了五代封建割据的局面,在一定时期之内,社会保持着相对的稳定,中原的经济
<正>刚入学的孩子是一群特殊的学生,他们从幼儿园刚刚跨入小学,对自己的行为没有认知,注意力容易分散,缺乏约束力。因此,我们一定要反思自己的教育教学行为,根据学生的年龄特
会议