论文部分内容阅读
统计分析是使林业科学结论定量化的重要工具之一。在林业科学研究中,人们大量应用着各种统计分析手段,然而,林业中统计分析方法的正确应用却一直是倍受关注的问题。本文就林业中模型的估计方法存在的部分问题进行深入的研究,为林业统计建模提供更多科学而有效的方法。文章主要研究模型中的共线性问题、异方差问题、度量误差问题和联立方程组模型估计问题。1.论文第三章中以思茅松多元树高模型为对象,采用200株思茅松数据,研究了模型中的共线性问题。在使用常规的逐步回归估计后,自变量由原来的9个缩减到4个,但模型中的共线性并没有得到消除。普通最小二乘法回归和基于普通最小二乘法的逐步回归是不能消除模型中的多重共线性的。逐步回归只是对变量进行筛选,删除对树高影响不显著的解释变量。论文再通过相关系数矩阵分析法,条件指数、容限度、方差膨胀因子判定法,通径分析法对共线性进行了深入分析,证实模型中的确存在着较强的多重共线性,其方差膨胀因子有两项大于10。文章通过岭回归,主成份回归和偏最小二乘法三种方法分别对多重共线性的多元线性树高模型进行估计。三种方法都能消除该模型中的多重共线性,其参数估计结果各不相同。为对比三种方法消除共线性的有效性,文章使用方差膨胀因子指标进行对比分析。分析结果说明岭回归在消除共线性上是非常有效的。相对主成份回归和偏最小二乘回归而言,岭回归会对模型中的其它解释变量进行综合调整,并且不会丢失模型中的信息。应用方差膨胀因子判定k值的方法,使得岭回归的使用也并不太难。根据方差膨胀因子结果判定,本文中的思茅松多元树高模型使用岭回归时,k值应取0.1370。主成份回归和偏最小二乘回归方法采用同一统计原理,只对产生共线性的数据部分进行处理。但由于信息量的丢失,可能会对共线性处理过度而造成回归系数出现偏差。在林业统计建模中应根据不同的条件选择不同的方法,本论文认为岭回归对于思茅松多元树高模型中共线性的消除最为有效,合理。2.论文第四章分别对思茅松树高曲线中的异方差和落叶松材积模型中的异方差进行了研究。前者为线性模型,后者为非线性模型,对于林业中模型的异方差性研究具有一定的代表性。文章通过异方差的检验证实模型中存在异方差性。林业中的观测数据因测量主体及方法的不同,异方差性的存在在所难免,只是强弱程度有所不同。在前人的研究基础上,文章分别使用了12种定式权函数及4种非定式权函数对思茅松树高曲线方程中的异方差性进行研究;同时采用了8种权函数形式对落叶松材积模型中的异方差性开展研究。对于思茅松树高曲线中的异方差消除,选择1/x2.334为权函数效果最好;对于落叶松材积模型中的异方差消除,选择1/D2H为权函数效果最好。通过加权回归估计消除异方差的方法,进一步验证了不同的模型具有不同的最优权函数形式的理论。在消除异方差时应试验多种权函数形式进行对比选优。在权函数的构造中,不能只是使用定式权函数形式,虽然同样也可以消除模型中的异方差性,但结果比较粗糙,不符合精细化的要求。如果模型在精度上有所要求,在权函数的选择上应该使用非定式权函数的方法。在异方差表现为线性结构时,非定式权函数中r的取值是受模型数据中的异方差性的强弱影响的,相同的模型不同的异方差性,其r值就不同。模型中异方差性越强,r就越远离0值;异方差性越弱,r就越接近0值,其权函数就越接近于1,越近似于最小二乘法。当异方差性是线性减小,即方差的线性斜率为负时,r取正值;减小幅度越大即斜率越小,r值就越大。当异方差性是线性增大,即方差的线性斜率为正时,r取负值;增大幅度越大即斜率越大,r值就越小。3.论文第五章研究了度量误差对于材积模型V = aDb的影响并使用度量误差模型方法对模型进行了参数估计,其结论是:当自变量无度量误差,因变量存在度量误差时,随着因变量度量误差方差的不断增大,模型参数的估计值波动是很大的,有着越来越不稳定的趋势。因变量的度量误差对模型参数的估计值是有影响的,使用通常的非线性回归方法对材积模型进行估计不会是最优的估计方法。当自变量存在度量误差,因变量没有误差时,随着自变量的度量误差方差不断增大,参数的估计值波动同样增大,也有着越来越不稳定的趋势;同时参数的估计值有着减小的趋势。自变量的度量误差同样对模型是有影响的。在通常的非线性回归方法中,我们假设自变量没有误差;或者其误差是无关紧要的,对模型是没有影响的做法是不恰当的。和林业中的其它观测数据一样,材积模型中自变量和因变量都是通过不同的测量工具和方法观测得到的,其中必然就存在度量误差。因变量和自变量都带有度量误差的模型参数估计是一个复杂的问题。通常的非线性回归方法都是假定自变量是没有误差的,这就不能简单地采用通常的非线性回归估计方法来估计材积模型。使用度量误差模型方法来估计材积模型,这是符合材积模型中因变量和自变量都有度量误差的实际情况。使用常规方法,材积V的残差平方和为0.5678,使用度量误差模型方法,材积V的残差平方和为0.4450。其估计结果使模型残差平方和变得更小,更符合方差最小的统计原则。当被解释变量所含的度量误差比较大时,常规参数估计方法使得估计参数既不是无偏的,也不是相合的估计量。而采用线性度量误差方法就可以得到无偏估计,只要误差矩阵估计得比较正确。该方法为带有度量误差的材积模型参数估计提供一个符合实际情况的更加有效的方法。4.在第六章中,文章以兴安落叶松为例,讨论了联立方程组模型在建立二元立木材积模型中的应用,以及二步估计在解联立方程组模型中的优越性,取得了良好的效果。本文初次使用了联立方程组模型方法来建立二元立木材积模型,该方法符合二元立木材积模型的建模原则。二元立木材积模型中,树高使用树高曲线方程中估计的平均树高,在联立方程组模型中可直接实现,不需要按传统方法分步进行估计。并且,该方法使同一树种的树高曲线方程与材积模型具有相容性。在联立方程组模型的求解中,本文使用在林业中较少使用的二步估计方法。在二步估计中,总相对误差RS=-0.1737,平均相对误差E=-2.6279,相对于普通非线性估计中的RS=-0.4615,E=-4.1514,其值更接近于0点。证实二步估计方法在参数估计中,不仅可以使参数估计具有无偏性,而且还能减少系统误差,该方法在解联立方程组模型中优于普通非线性估计。文中的联立方程组模型及二步估计方法在求解二元立木材积模型具有一定的优越性。其方法具有简洁易操作性,并且估计结果优于传统方法。