论文部分内容阅读
【摘 要】本文收集了临汾市耕地资源和多种社会经济发展指标,运用主成分分析、聚类分析和线性回归分析方法对各个指标进行统计分析,得出临汾市耕地资源与社会经济综合指标在建国以来到2005年三个时间段的线性回归模型,可以看出临汾市耕地资源随着社会经济综合指标的发展有逐渐减少的趋势。
【关键词】耕地资源;社会经济指标;主成分分析;线性回归分析
加大对临汾市耕地资源和社会经济发展的动态数据关系分析,有助于实现临汾市利用耕地资源合理化和耕地资源的内部利用结构的优化,并对实现耕地资源和社会经济发展的可持续有着重要的积极意义。
1.模型的建立和方法的运用
主成分分析是将具有大量相关性的p个指标从新组合成彼此不相关的q个综合指标来替代原来p个指标的分析功能。它的模型是:
F1=a11ZX1+a21ZX2+K+ap1ZXpF2=a12ZX1+a22ZX2+K+ap2ZXpKKFq=a1qZX1+a2qZX2+K+apqZXp公式1
公式中,a11、a21、ap1、…、a12、…、apq为X的协方差阵∑的特征值对应的特征向量,ZX1、ZX2、…、ZXp是所有变量经过标准化处理后的值(由于指标存在量纲的差异,故这里需要数据Z标准化处理),F1、F2、…、Fq是第一、第二到第q个主成分值。
得出所有主成分公式及主成分值之后,以每个主成分所对应的特征值占q个主成分特征值之和的比例作为权重得出主成分综合模型[1][2]。
F综合=b1ZX1+b2ZX2+…+ bpZXp 公式2
得出F綜合值之后,与耕地面积进行聚类分析,得到对应的时间段聚类结果,然后进行各时间段的线性回归分析。聚类分析是多元统计方法的一种,他是根据p种指标的数据定量的确定p种指标之间的相似性,并进行相通数据的归类。聚类分析法有很多种,这里主要运用系统聚类法。这里线性回归分析主要是指一元线性回归模型。
2.临汾市社会经济指标SPSS主成分分析
根据上述主成分分析的有关思路和临汾市的实际情况,以临汾市建国以来到2009年为相关统计时间段,选取22个社会经济指标作为临汾市社会经济指标SPSS综合分析的变量进行主成分分析[3]。这22个变量指标分别为:城镇居耕地面积X0、人均消费性支出X1、城镇居民人均可支配收入X2、农民人均纯收入X3、原煤产量X4、地区生产总值X5、人均地区生产总值X6、第一产业产值X7、第二产业产值X8、社会消费品零售总额X9、粮食总产量X10、总播种面积X11、粮食播种面积X12、粮食单产X13、复种指数X14、垦殖率X15、农业机械总动力X16、人口总数X17、城镇人口X18、乡村人口X19、人口自然增长率X20、城市化综合指标X21。
上述22个指标标准化之后数据进行处理的方法:对缺失值进行平均值替换,处理过程中使用方差最大法正交旋转(旋转收敛的迭代系数为25)得到有关数据。根据特征值大于1的原则,提取出本文所需的3个主成分因子,这3个主成分反映了所有数据指标92.696%的信息量,足以充分的分析所有的数据的变化。
再通过SPSS16.0中的Transform--Compute Variable对旋转前主成分提取的数据进行计算,求得协方差阵∑的特征值对应的特征向量,即可得到各主成分公式,进一步求的主成分综合模型。如下:
F综合=0.080ZX0+0.209ZX1+0.211ZX2+0.206ZX3+0.163ZX4+0.213ZX5
+0.213ZX6+0.187ZX7+0.212ZX8+0.213ZX9+0.124ZX10+0.046ZX11
+0.094ZX12+0.103ZX13-0.053ZX14+0.080ZX15+0.155ZX16+0.111ZX17
+0.176ZX18+0.063ZX19-0.096ZX20+0.163ZX21 公式3
把指标数据带入公式3中即可得出相关的综合主成分值并进行排序,可以得出临汾市社会经济综合指标基本上呈现上升趋势,时间离现在越近,F综合值就越大,说明临汾市的社会经济发展越来越好,尤其是近年来,进步的程度越来越高。
3.临汾市耕地面积和F综合值SPSS聚类分析
由于临汾市建国以来社会经济发展的不同历史阶段,势必造成社会经济因素对耕地面积在不同时期内具有不同的影响程度,而长时间的序列数据分析会模糊发展过程中对耕地面积影响程度的大小,因此有必要进行时间段的聚类[4]。运用SPSS16.0中Analyze—Classify—Two
Step cluster对耕地面积和F综合值进行二阶段聚类分析,得到相应的三个时间段,分别是⑴1949—1957年,⑵1958—1996年,⑶1997—200
9年。
4.耕地面积和F综合指标值线性回归统计分析
依据上述聚类结果的分析,对耕地面积Y和F综合指标值X分三个时间段进行线性回归统计分析[5]。
运用SPSS16.0中Analyze—Regression—Linear对1949—1957、1958—1996和1997—2005年的耕地面积和F综合指标值进行分析,结果显示自变量耕地面积和因变量F综合指标值拟合度很好,差异显著。
然后,结合1949—1957、1958—1996和1997—2005年F综合指标值X和因变量耕地面积Y回归系数,可以得到耕地面积Y和F综合指标值X的线性回归方程。
即: Y=641.897+78.288X 公式4
Y=416.134-19.969X 公式5
Y=579.094-26.026X 公式6
从得出的回归方程公式中可以看出,F综合指标值X每增加一个单位,1949—1957年耕地面积增加78.288千公顷,1958—1996年减少19.969千公顷,1997—2005年耕地面积减少26.026千公顷。
5.结论
对上述三个时间段进行线性回归分析得出的数据显示随着时间的推进,耕地面积有加快减少的趋势,这与近年来社会经济的高速发展密切相关,因此耕地资源与社会经济的可持续发展矛盾日渐突出。
【参考文献】
[1]张文霖.主成分分析在SPSS中的操作应用[J].理论与方法.2005.12.
[2]胡汪洋.景玎.冯民.于宏民.沈阳市自然资源评价研究[J].经济管理与人文科学.
[3]临汾市统计局.临汾市统计年鉴[M].中国统计出版社.2008.2009.
[4]张文彤主编.SPSS统计分析高级教程[M].高等教育出版社.2004.235-260.
[5]张文彤主编.SPSS统计分析基础教程[M].高等教育出版社.2004.325-347.
【关键词】耕地资源;社会经济指标;主成分分析;线性回归分析
加大对临汾市耕地资源和社会经济发展的动态数据关系分析,有助于实现临汾市利用耕地资源合理化和耕地资源的内部利用结构的优化,并对实现耕地资源和社会经济发展的可持续有着重要的积极意义。
1.模型的建立和方法的运用
主成分分析是将具有大量相关性的p个指标从新组合成彼此不相关的q个综合指标来替代原来p个指标的分析功能。它的模型是:
F1=a11ZX1+a21ZX2+K+ap1ZXpF2=a12ZX1+a22ZX2+K+ap2ZXpKKFq=a1qZX1+a2qZX2+K+apqZXp公式1
公式中,a11、a21、ap1、…、a12、…、apq为X的协方差阵∑的特征值对应的特征向量,ZX1、ZX2、…、ZXp是所有变量经过标准化处理后的值(由于指标存在量纲的差异,故这里需要数据Z标准化处理),F1、F2、…、Fq是第一、第二到第q个主成分值。
得出所有主成分公式及主成分值之后,以每个主成分所对应的特征值占q个主成分特征值之和的比例作为权重得出主成分综合模型[1][2]。
F综合=b1ZX1+b2ZX2+…+ bpZXp 公式2
得出F綜合值之后,与耕地面积进行聚类分析,得到对应的时间段聚类结果,然后进行各时间段的线性回归分析。聚类分析是多元统计方法的一种,他是根据p种指标的数据定量的确定p种指标之间的相似性,并进行相通数据的归类。聚类分析法有很多种,这里主要运用系统聚类法。这里线性回归分析主要是指一元线性回归模型。
2.临汾市社会经济指标SPSS主成分分析
根据上述主成分分析的有关思路和临汾市的实际情况,以临汾市建国以来到2009年为相关统计时间段,选取22个社会经济指标作为临汾市社会经济指标SPSS综合分析的变量进行主成分分析[3]。这22个变量指标分别为:城镇居耕地面积X0、人均消费性支出X1、城镇居民人均可支配收入X2、农民人均纯收入X3、原煤产量X4、地区生产总值X5、人均地区生产总值X6、第一产业产值X7、第二产业产值X8、社会消费品零售总额X9、粮食总产量X10、总播种面积X11、粮食播种面积X12、粮食单产X13、复种指数X14、垦殖率X15、农业机械总动力X16、人口总数X17、城镇人口X18、乡村人口X19、人口自然增长率X20、城市化综合指标X21。
上述22个指标标准化之后数据进行处理的方法:对缺失值进行平均值替换,处理过程中使用方差最大法正交旋转(旋转收敛的迭代系数为25)得到有关数据。根据特征值大于1的原则,提取出本文所需的3个主成分因子,这3个主成分反映了所有数据指标92.696%的信息量,足以充分的分析所有的数据的变化。
再通过SPSS16.0中的Transform--Compute Variable对旋转前主成分提取的数据进行计算,求得协方差阵∑的特征值对应的特征向量,即可得到各主成分公式,进一步求的主成分综合模型。如下:
F综合=0.080ZX0+0.209ZX1+0.211ZX2+0.206ZX3+0.163ZX4+0.213ZX5
+0.213ZX6+0.187ZX7+0.212ZX8+0.213ZX9+0.124ZX10+0.046ZX11
+0.094ZX12+0.103ZX13-0.053ZX14+0.080ZX15+0.155ZX16+0.111ZX17
+0.176ZX18+0.063ZX19-0.096ZX20+0.163ZX21 公式3
把指标数据带入公式3中即可得出相关的综合主成分值并进行排序,可以得出临汾市社会经济综合指标基本上呈现上升趋势,时间离现在越近,F综合值就越大,说明临汾市的社会经济发展越来越好,尤其是近年来,进步的程度越来越高。
3.临汾市耕地面积和F综合值SPSS聚类分析
由于临汾市建国以来社会经济发展的不同历史阶段,势必造成社会经济因素对耕地面积在不同时期内具有不同的影响程度,而长时间的序列数据分析会模糊发展过程中对耕地面积影响程度的大小,因此有必要进行时间段的聚类[4]。运用SPSS16.0中Analyze—Classify—Two
Step cluster对耕地面积和F综合值进行二阶段聚类分析,得到相应的三个时间段,分别是⑴1949—1957年,⑵1958—1996年,⑶1997—200
9年。
4.耕地面积和F综合指标值线性回归统计分析
依据上述聚类结果的分析,对耕地面积Y和F综合指标值X分三个时间段进行线性回归统计分析[5]。
运用SPSS16.0中Analyze—Regression—Linear对1949—1957、1958—1996和1997—2005年的耕地面积和F综合指标值进行分析,结果显示自变量耕地面积和因变量F综合指标值拟合度很好,差异显著。
然后,结合1949—1957、1958—1996和1997—2005年F综合指标值X和因变量耕地面积Y回归系数,可以得到耕地面积Y和F综合指标值X的线性回归方程。
即: Y=641.897+78.288X 公式4
Y=416.134-19.969X 公式5
Y=579.094-26.026X 公式6
从得出的回归方程公式中可以看出,F综合指标值X每增加一个单位,1949—1957年耕地面积增加78.288千公顷,1958—1996年减少19.969千公顷,1997—2005年耕地面积减少26.026千公顷。
5.结论
对上述三个时间段进行线性回归分析得出的数据显示随着时间的推进,耕地面积有加快减少的趋势,这与近年来社会经济的高速发展密切相关,因此耕地资源与社会经济的可持续发展矛盾日渐突出。
【参考文献】
[1]张文霖.主成分分析在SPSS中的操作应用[J].理论与方法.2005.12.
[2]胡汪洋.景玎.冯民.于宏民.沈阳市自然资源评价研究[J].经济管理与人文科学.
[3]临汾市统计局.临汾市统计年鉴[M].中国统计出版社.2008.2009.
[4]张文彤主编.SPSS统计分析高级教程[M].高等教育出版社.2004.235-260.
[5]张文彤主编.SPSS统计分析基础教程[M].高等教育出版社.2004.325-347.