论文部分内容阅读
【摘 要】 本文采用2007年我国31省、市、自治区城镇居民平均每人全年消费性支出数据,包括以下八个变量:X1:平均每人全年总消费支出;X2:平均每人全年食品支出;X3:平均每人全年住房支出;X4:平均每人全年医疗保健支出;X5:平均每人全年教育文化娱乐支出;X6:平均每人全年可支配收入;X7:东部地区虚拟变量:X8:西部地区虚拟变量,其余为中部地区省份。本文通过描述统计大致分析东西部地区的经济收入与消费水平状况;利用因子分析方法将具有复杂关系的变量综合为数量较少的几个公共因子,并对其进行评价分析。
【关键词】 消费水平 描述统计 因子分析
研究背景
居民平均每人全年的各项支出以及全年可支配收入均有东部地区>中部地区>西部地区,这与我国经济发展的不平衡状况相一致。
一、图示
在东部地区,中部地区,西部地區中分别选择一个城市,以北京,山西,贵州为例,使
用MATLAB中的 parallelcoords(X),glyphplot(X), andrewsplot(X)命令绘制轮廓图,蛛网图以及调和曲线图如下。
由图示可以看出,东部地区经济发展状况最好,且居民在各个方面的消费支出比例大致
相等,而中西部地区经济发展状况偏低,且居民在各个方面的支出情况极端不平衡。
二、因子分析
由所给数据,评价我国各地区消费水平的指标共有6个,现使用因子分析的方法,将这6个变量综合为更少的几个公共因子,即根据变量相关性大小将变量分组,把相关性较高的变量归在同一组中,使不同组的变量相关性较低。
首先,选择3个公因子,因子分析结果如下:
rownames(X)=X[,1]
fact=factanal(X[2:7],3,scores="Bartlett",rotation="varimax"); fact
由上述结果可知,前两个公因子的方差贡献率为83.3%,若以80%为标准,则选择两个公因子为好。
现在选择2个公因子重新进行因子分析:
fact=factanal(X[2:7],2,scores="Bartlett",rotation="varimax"); fact
factanal(x = X[2:7], factors = 2, scores = "Bartlett", rotation ="varimax")
因子模型:
X1*=0.807f1+0.586f2
X2*=0.971f1+0.230f2
X3*=0.580f1+0.658f2
X4*=0.215f1+0.772f2
X5*=0.693f1+0.680f2
X6*=0.792f1+0.573f2
可见,公因子f1在变量X1,X2,X6上的载荷很大,反映了居民总支出与总收入情况,尤其是食品支出情况,公因子f2在变量X3,X4,X5上的载荷很大,反映了居民住房,医疗保健,教育文化的支出情况。
【参考文献】
李素兰.数据分析与R软件.科学出版社.2013.06。
作者简介:郝静(1994—),女,汉族,山东烟台人,中国石油大学(华东)理学院,2013级本科生,数学与应用数学专业 快递地址:山东省青岛市黄岛区长江西路66号中国石油大学(华东)电话:18706487297 邮编:266580
杨菁蓓(1995—),女,汉族,河南人,中国石油大学(华东)理学院,2013级本科生,数学与应用数学专业 。
【关键词】 消费水平 描述统计 因子分析
研究背景
居民平均每人全年的各项支出以及全年可支配收入均有东部地区>中部地区>西部地区,这与我国经济发展的不平衡状况相一致。
一、图示
在东部地区,中部地区,西部地區中分别选择一个城市,以北京,山西,贵州为例,使
用MATLAB中的 parallelcoords(X),glyphplot(X), andrewsplot(X)命令绘制轮廓图,蛛网图以及调和曲线图如下。
由图示可以看出,东部地区经济发展状况最好,且居民在各个方面的消费支出比例大致
相等,而中西部地区经济发展状况偏低,且居民在各个方面的支出情况极端不平衡。
二、因子分析
由所给数据,评价我国各地区消费水平的指标共有6个,现使用因子分析的方法,将这6个变量综合为更少的几个公共因子,即根据变量相关性大小将变量分组,把相关性较高的变量归在同一组中,使不同组的变量相关性较低。
首先,选择3个公因子,因子分析结果如下:
rownames(X)=X[,1]
fact=factanal(X[2:7],3,scores="Bartlett",rotation="varimax"); fact
由上述结果可知,前两个公因子的方差贡献率为83.3%,若以80%为标准,则选择两个公因子为好。
现在选择2个公因子重新进行因子分析:
fact=factanal(X[2:7],2,scores="Bartlett",rotation="varimax"); fact
factanal(x = X[2:7], factors = 2, scores = "Bartlett", rotation ="varimax")
因子模型:
X1*=0.807f1+0.586f2
X2*=0.971f1+0.230f2
X3*=0.580f1+0.658f2
X4*=0.215f1+0.772f2
X5*=0.693f1+0.680f2
X6*=0.792f1+0.573f2
可见,公因子f1在变量X1,X2,X6上的载荷很大,反映了居民总支出与总收入情况,尤其是食品支出情况,公因子f2在变量X3,X4,X5上的载荷很大,反映了居民住房,医疗保健,教育文化的支出情况。
【参考文献】
李素兰.数据分析与R软件.科学出版社.2013.06。
作者简介:郝静(1994—),女,汉族,山东烟台人,中国石油大学(华东)理学院,2013级本科生,数学与应用数学专业 快递地址:山东省青岛市黄岛区长江西路66号中国石油大学(华东)电话:18706487297 邮编:266580
杨菁蓓(1995—),女,汉族,河南人,中国石油大学(华东)理学院,2013级本科生,数学与应用数学专业 。