论文部分内容阅读
摘 要:本文根据新疆经济的现状,结合1988—2004年新疆12个地区及2个市的农业截面及时序数据,运用聚类分析、主成分分析实证研究了新疆区域经济差异的现状及其影响因素、区域差异对经济增长的影响及其未来发展趋势的预测和预警分析,并针对研究结论提出相应的对策和建议。
关键词:区域经济差异;经济增长;实证研究
从地区、自治州(包括地级市)的中区域层面入手,运用系统聚类法对新疆各个地区进行归类。系统聚类法是聚类分析诸方法中用的最多的一种,其基本思想:首先将n个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成为一个新类,计算新类与其它类的距离;重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类。较常用的类与类之间的距离计算方法共有11种,各种方法适用的数据的类型不同,采用离差平方和法(ward法),因为该方法包含的信息量大,是一种常用的比较好的系统聚类方法。
根据SAS软件聚类分析过程提供的树形图及结合伪F统计量、伪统计量和树形图,本文把这14个区域分为如下4类:
1.经济发达区域,包括乌鲁木齐、吐鲁番
2.经济稳定发展中区域,包括吐鲁番、阿克苏、阿勒泰、伊犁直属、博州和巴州
3.经济欠发展区域,包括和田、克孜勒苏和喀什
4.经济特殊发展区域,只包括克拉玛依
从聚类分析的结果可以看出克拉玛依应该属于农业稳定发达区域和乌鲁木齐、哈密等区域划为一类,克拉玛依市具有建设粮棉基地得天独厚的条件,丰富的土地资源(宜农荒地二级一等草甸土218.6万亩,地势平坦连片),丰裕的光热资源(全年≥10℃的积温为3600-3900℃),最为重要的是它以石油工业为后盾的资金、人才、机械及配套设施等优势使克拉玛依农业开发一开始就不同于其它区域。下图是主成分的散点图也可以看出克拉玛依的特殊性。因此,本文把克拉玛依作为特殊的一类来处理。
区域差异的主导性分析
以上用聚类法分类研究农业区域经济差异,是为全面考察各个地州在农业生产要素投入的规模、强度和效益。而主导性分析,则是着重考察农业投入和产出水平在新疆所占的地位和作用。本文拟采用主成份分析研究主导性状况。
主成分分析基本思想:在分析问题时为充分反映个体的差异,我们希望对每一个体测量得到尽可能多的指标,但是指标的增加会增加分析问题的复杂性。人们自然希望能用较少的指标要尽可能的反映原来指标提供的信息。而在大多数实际问题中,变量之间存在者一定的相关性,主成分分析就是通过这些相关性把原始变量线性组合,使其转化为有代表意义的少数几个相互独立的指标,以使原指标能更集中更典型地表明研究对象特征的一种多元统计方法。假定xx=(x1,x2…xp)T,是一组随机变量,并且Ex=u,Var(x)=V。考虑x1,x2…xp的一个线形组合:
Z=a1x1+a2x2+…+apxp=arx
这里规定aTa=1,求Var(aTx)的最大值。根据拉格朗日极值定理,可以证明再此情况下的
Var(aTx)的最大值等价于maxa≠0(aTva/aTa))的值,就等于矩阵V的最大特征根λi,ai就是λi对应的特征向量。把特征向量分别代入Z就得到原指标的各个主成分。
考虑到新疆农业经济发展的规模、结构、效益、活力、人口教育水平、抗灾能力等因素本文收集到了新疆12个地区及2个市的11个相对指标,利用SAS软件分析结果可以看出,前三个主成分的累计贡献率已达到85%以上,它们已经能很好地概括原始变量,因此只取前三个主成分做为分析的变量。利用各主成分的载荷(特征向量)值可以对各主成分作出符合实际意义的解释。第一主成分y1除了在受灾面积有较小的载荷以外几乎对所有(标准化)原始变量都有近似相等的正载荷。大的y1值意味着各变量都倾向于有大的值。因此本文称第一主成分为综合成分;第二主成分y2在农业固定资产投资和农业用地有较大的正载荷,而在农作物总产量有较大负载荷,在农业机械总动力和化肥施用量上有中度的负载荷。大(小)的y2意味着农业固定资产投资和农业用地都倾向于有大(小)的值,而农作物总产量、农业机械总动力和化肥施用量倾向于有小(大)的值。因此称第二主成分为投资效率成分;第三主成分y3在受灾面积有很大的正载荷,在化肥施用量上有中度的正载荷,而在牧林渔业产值上有较大的负载荷,在初中以上文化从业人员上有中度的负载荷。大(小)的
y3意味着受灾面积和化肥施用量都倾向于有大(小)的值,而牧林渔业产值和初中以上文化从业人员倾向于有小(大)的值。因此称第三主成分为灾害成分。需要指出的是为了研究11个原始变量之间是否从在共线性,有必要看一下最后一个主成分,计算结果为:
λ11=0.001
T11=(-0.767,-0.131,0.091,-0.022,0.214,-0.079,0.004,-0.055,0.438,-0.009,0.371)T,
由于λ11非常小。所以存在这样一个线性关系:
λ11=-0.767*X1-0.131*X2+0.091*X3-0.022*X4+0.214*X5-0.079*X6+0.004*X7-0.055*X8+0.438*X9-
0.009*X10+0.371*X11≈0
即表示11个原始变量之间肯定存在几个共线性关系,因而主成分分析是必要的。按所得的主成分得分从大到小排序后对各个地区加以辨别,结果显示各地区在农业经济方面的综合排名(按第一主成分“综合成分”的排名)与聚类的结果是完全一致的,农业经济综合排名较靠前的地区主要集中在天上北坡经济带上。在按第二主成分排名的顺序上显示一些农业较发达的地区排名比较靠前是因为这些地区农业物耗高较高、农业固定资产投入产出量相对较低引起的。这也同时反映我区部分农业发达区域仍然为粗放型,其经济增长方式靠高投入和高消耗支撑着。一旦超出支撑极限农业经济马上会出现滑坡。第三主成分显示的灾害排名,反映了我区农业受自然灾害由重到轻的排列情况。
参考文献:
[1]张许颖.计量经济学[M].郑州大学出版社,2004.
[2]沈坤荣.1979—1997年中国经济增长因素的实证分析[J].经济科学,1999;(4).
[3]詹锋,田俊刚,朱晖.我国经济增长因素的实证研究[J].国民经济管理,2003;(8).
[4]新疆统计局.1990-2006年新疆生产建设兵团统计年鉴[Z].中国统计出版社,1990-2006.
[5]新疆石河子市计划委员会.农八师石河子市国民经济和社会发展第十一个五年规划纲要[EB/OL].http://jhw.shz.gov.cn.
关键词:区域经济差异;经济增长;实证研究
从地区、自治州(包括地级市)的中区域层面入手,运用系统聚类法对新疆各个地区进行归类。系统聚类法是聚类分析诸方法中用的最多的一种,其基本思想:首先将n个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成为一个新类,计算新类与其它类的距离;重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类。较常用的类与类之间的距离计算方法共有11种,各种方法适用的数据的类型不同,采用离差平方和法(ward法),因为该方法包含的信息量大,是一种常用的比较好的系统聚类方法。
根据SAS软件聚类分析过程提供的树形图及结合伪F统计量、伪统计量和树形图,本文把这14个区域分为如下4类:
1.经济发达区域,包括乌鲁木齐、吐鲁番
2.经济稳定发展中区域,包括吐鲁番、阿克苏、阿勒泰、伊犁直属、博州和巴州
3.经济欠发展区域,包括和田、克孜勒苏和喀什
4.经济特殊发展区域,只包括克拉玛依
从聚类分析的结果可以看出克拉玛依应该属于农业稳定发达区域和乌鲁木齐、哈密等区域划为一类,克拉玛依市具有建设粮棉基地得天独厚的条件,丰富的土地资源(宜农荒地二级一等草甸土218.6万亩,地势平坦连片),丰裕的光热资源(全年≥10℃的积温为3600-3900℃),最为重要的是它以石油工业为后盾的资金、人才、机械及配套设施等优势使克拉玛依农业开发一开始就不同于其它区域。下图是主成分的散点图也可以看出克拉玛依的特殊性。因此,本文把克拉玛依作为特殊的一类来处理。
区域差异的主导性分析
以上用聚类法分类研究农业区域经济差异,是为全面考察各个地州在农业生产要素投入的规模、强度和效益。而主导性分析,则是着重考察农业投入和产出水平在新疆所占的地位和作用。本文拟采用主成份分析研究主导性状况。
主成分分析基本思想:在分析问题时为充分反映个体的差异,我们希望对每一个体测量得到尽可能多的指标,但是指标的增加会增加分析问题的复杂性。人们自然希望能用较少的指标要尽可能的反映原来指标提供的信息。而在大多数实际问题中,变量之间存在者一定的相关性,主成分分析就是通过这些相关性把原始变量线性组合,使其转化为有代表意义的少数几个相互独立的指标,以使原指标能更集中更典型地表明研究对象特征的一种多元统计方法。假定xx=(x1,x2…xp)T,是一组随机变量,并且Ex=u,Var(x)=V。考虑x1,x2…xp的一个线形组合:
Z=a1x1+a2x2+…+apxp=arx
这里规定aTa=1,求Var(aTx)的最大值。根据拉格朗日极值定理,可以证明再此情况下的
Var(aTx)的最大值等价于maxa≠0(aTva/aTa))的值,就等于矩阵V的最大特征根λi,ai就是λi对应的特征向量。把特征向量分别代入Z就得到原指标的各个主成分。
考虑到新疆农业经济发展的规模、结构、效益、活力、人口教育水平、抗灾能力等因素本文收集到了新疆12个地区及2个市的11个相对指标,利用SAS软件分析结果可以看出,前三个主成分的累计贡献率已达到85%以上,它们已经能很好地概括原始变量,因此只取前三个主成分做为分析的变量。利用各主成分的载荷(特征向量)值可以对各主成分作出符合实际意义的解释。第一主成分y1除了在受灾面积有较小的载荷以外几乎对所有(标准化)原始变量都有近似相等的正载荷。大的y1值意味着各变量都倾向于有大的值。因此本文称第一主成分为综合成分;第二主成分y2在农业固定资产投资和农业用地有较大的正载荷,而在农作物总产量有较大负载荷,在农业机械总动力和化肥施用量上有中度的负载荷。大(小)的y2意味着农业固定资产投资和农业用地都倾向于有大(小)的值,而农作物总产量、农业机械总动力和化肥施用量倾向于有小(大)的值。因此称第二主成分为投资效率成分;第三主成分y3在受灾面积有很大的正载荷,在化肥施用量上有中度的正载荷,而在牧林渔业产值上有较大的负载荷,在初中以上文化从业人员上有中度的负载荷。大(小)的
y3意味着受灾面积和化肥施用量都倾向于有大(小)的值,而牧林渔业产值和初中以上文化从业人员倾向于有小(大)的值。因此称第三主成分为灾害成分。需要指出的是为了研究11个原始变量之间是否从在共线性,有必要看一下最后一个主成分,计算结果为:
λ11=0.001
T11=(-0.767,-0.131,0.091,-0.022,0.214,-0.079,0.004,-0.055,0.438,-0.009,0.371)T,
由于λ11非常小。所以存在这样一个线性关系:
λ11=-0.767*X1-0.131*X2+0.091*X3-0.022*X4+0.214*X5-0.079*X6+0.004*X7-0.055*X8+0.438*X9-
0.009*X10+0.371*X11≈0
即表示11个原始变量之间肯定存在几个共线性关系,因而主成分分析是必要的。按所得的主成分得分从大到小排序后对各个地区加以辨别,结果显示各地区在农业经济方面的综合排名(按第一主成分“综合成分”的排名)与聚类的结果是完全一致的,农业经济综合排名较靠前的地区主要集中在天上北坡经济带上。在按第二主成分排名的顺序上显示一些农业较发达的地区排名比较靠前是因为这些地区农业物耗高较高、农业固定资产投入产出量相对较低引起的。这也同时反映我区部分农业发达区域仍然为粗放型,其经济增长方式靠高投入和高消耗支撑着。一旦超出支撑极限农业经济马上会出现滑坡。第三主成分显示的灾害排名,反映了我区农业受自然灾害由重到轻的排列情况。
参考文献:
[1]张许颖.计量经济学[M].郑州大学出版社,2004.
[2]沈坤荣.1979—1997年中国经济增长因素的实证分析[J].经济科学,1999;(4).
[3]詹锋,田俊刚,朱晖.我国经济增长因素的实证研究[J].国民经济管理,2003;(8).
[4]新疆统计局.1990-2006年新疆生产建设兵团统计年鉴[Z].中国统计出版社,1990-2006.
[5]新疆石河子市计划委员会.农八师石河子市国民经济和社会发展第十一个五年规划纲要[EB/OL].http://jhw.shz.gov.cn.