论文部分内容阅读
摘 要: 对于城市的建筑商品房价格,不同城市的商品房销售价格不同,而且影响城市商品房销售价格的因素多种多样,多元统计分析方法可以有效地分析出多元数据指标对于某一个指标数据的影响。本文通过建立商品房销售价格与城市的发展指标之间联系的数学模型,分析了城市的发展指标对于建筑商品房平均售价的影响程度。首先通过对中国统计年鉴中35个大中城市的经济发展指标进行主成分分析,用得到的较少个数的综合主成分指标替代原始数据,然后初步分析建筑销售均价与城市发展指标的关系,并对选定的价格方程进行多元回归分析,建立商品房价格和城市经济发展指标间关系的数学评价模型。于此同时,由于城市商品房销售价格与经济发展指标间的的关系不确定性,我们又针对主成分分析的弊端设计了非线性的主成分分析的评价方式,并进行了比较和统计分析。
关键词: 多元统计分析;非线性主成分分析;多元回归分析;城市建筑价格影响因素
引言
城市的建筑产品是一种异质性商品,建筑产品在决定使用价值的各个因素上面会有明显的差异,如城市的人口、经济发展指标和建筑面积等因素都与城市建筑商品房均价有一定的关联。对于众多影响因素,指标数量过多会使课题的复杂性加大。我们希望可以通过较少的指标个数得到的比较多的信息量。主成分分析对数据指标数目的降维将使得问题更为简单方便。[1]
而且由于建筑价格影响因素可能是非线性的,所以我们也将非线性主成分分析法与传统主成分方法进行比较,并结合多元线性回归分析和spss软件,对城市建筑商品房均价建立非线性的综合评价体系模型。
1综合评价体系的多元统计分析方法概述
1.1城市经济发展指标的主成分分析
对于决定建筑商品房价格的城市经济发展指标,指标之间有一定的关联性,可以理解为这两个指标之间对于决定建筑商品房价格的信息有一定的重叠。主成分分析是数学中的一种降维方法,它可以根据实际的需求把原来的指标重新组合成一组新的相互间线性无关的综合指标,也就是从其中抽取出少数几个主成分,这些主成分将尽可能多地表达原始变量的信息。通过对多个城市建筑样本和城市发展指标数据的压缩、解释,它也可以用来寻找影响城市商品房价格的综合指标,然后适当地说明综合指标所涵盖的信息意义,以便于更加清晰地了解问题的内在发展规律。
1.2非線性主成分分析
主成分分析法只能处理线性问题,实际问题例如城市建筑商品房影响因素这一问题中,不仅变量间有可能会有非线性的关系,而且主成分和原始变量间也存在着非线性的关系。此时如果只是进行线性化数据处理,必然影响研究结果的准确度。
非线性主成分分析法的方法有很多种[2],而在这之中,“对数中心化”是其中较为实用的一种的方法。
设有n个城市,p个经济发展指标。
(1)首先对原始指标的数据做对数中心化数据变换:
(2)计算对数中心化后的数据的样本协方差矩阵
(3)利用样本协方差矩阵S 求原始数据的主成分。设它们的特征值为λ1 ≥λ2 ≥… ≥λp ≥0 并且这些特征值相应的特征向量为ep,从而得到主成分为
剩下的步骤和传统线性的主成分分析方法一样。
与传统的主成分分析相比,非线性的主成分分析法有2处提高: 1.原始指标通过对数中心化这一变换,主成分被表示为原始变量的非线性组合;2.非线性的主成分分析法的出发点不再是相关系数矩阵,而是协方差矩阵。这两处提高将会使用较少的主成分反映更多的原始变量的信息,从而大大地提高数据降维的效果。
1.3主成分的多元回归分析
本文中的实例应用中我们将以城市建筑商品房价格Y为因变量,主成分F1,F2,…,Fk为自变量,利用线性回归方程方法可以建立综合评价体系的数学方程模型:
将主成分F1,F2,…,Fk的表达式,就能得到综合评价体系模型。
2建筑价格综合评价体系的数据收集与计算过程
我们搜集了中国统计年鉴2015年的统计数据,根据相关领域的研究,依据全面性、系统性、可比性、科学性和可取得性的原则[5],选择了中国35个主要城市建筑商品房价格受到的城市经济发展指标影响因素如下:总人口(X1),人均gdp(X2),居民消费指数(X3),人均公共财政收入(X4),人均公共财政支出(X5),平均工资(X6),人均消费品零售额(X7),人均居民储蓄存款(X8),人均住房面积(X9),建筑造价(X10)。
3综合评价体系的最终构建过程与结果分析
3.1非线性主成分分析与传统主成分分析的结果对比
我们在多元统计分析的数据搜集和分析时,往往需要收集到不同量纲的数据,比如总人口(万人),人均gdp(元)。我们已经对《中国统计年鉴》城市经济指标数据标准化,得到了标准化矩阵。
(1) 利用对数中心化的方法对城市经济发展的原始指标数据进行处理。
(2) 对对数中心化处理后的样本(lnXij)的协方差矩阵进行非线性的主成分分析。相关系数矩阵计算出的特征值及其累积贡献率见表1。
非线性主成分分析与普通线性主成分分析的特征值及累积贡献率的对比结果如下表所示:
由上表可以看出,非线性主成分分析的第一主成分比传统主成分分析法所携带的信息量高了13个百分点,非线性主成分分析法的前2个主成分的累计贡献率超过了90%,而传统方法前5个主成分才能超过90%,非线性主成分分析法可以用更多的主成分提取较多的原始指标信息,所以非线性主成分分析法更加适用于分析城市建筑商品房价格的影响指标因素。
根据贡献率大于85%原则,提取前2个特征值为主成分,进一步分析非线性主成分载荷矩阵得出[a1,a2]。进一步计算出主成分的特征向量[t1,t2]。 主成分和原指标之间的关系式,可以通过主成分的载荷矩阵求出。
表2中的系数为aij,主成分和原指标之间的关系式分别为:
主成分:
3.2非线性主成分分析的回归模型
分别将原始指标数据对数中心化后的数据lnXij代入方程,求得Fi( i = 1,2,3,4) ,然后将Fi当作自变量,将各城市商品房销售均价Y的对数中心化数据lnY作为因变量,回归方程的系数矩阵如下:
由表3可以得出回归系数估计值为:β1=8769.800得到城市商品房销售价格的回归方程:
式中: lnY 为商品房销售价格的标准化数据; Fi为各主成分的值,i = 1,2,3.
把式带入方程:
原始指标数据在回归模型方程中的系数以及标准化后的系数如下表:
因此反映城市经济发展指标与商品房价格关系的回归模型标准化方程为:
其中,βk为表5中回归方程系数。
3.3模型分析
通过对数中心化的数据lnY与lnX的多元回归方程可以看出城市经济指标对于城市建筑价格的影响程度,继而分析出其中间的关系。
多元回归分析的假设检验结果如表4,由表中可以得出判定系数为0.736,回归方程的拟合程度较好。F值为44.572,显著度为0.000,表明回归极显著。
同时,由表5中标准化后的系数对比可以看出,城市经济发展指标对于房价的影响可以分为以下四个等级:
(1)人均gdp(X2),人均公共财政收入(X4),人均公共财政支出(X5),人均消费品零售额(X7),人均居民储蓄存款(X8)的系数均大于0.3,这说明这些城市的经济指标很大程度上决定了城市商品房平均价格。
(2) lnX1,lnX6,lnX10所对应的原始数据中城市经济指标总人口(X1),平均工资(X6),建筑造价(X10)的系数在0.1左右,他们作为城市经济指标对于城市建筑商品房的价格也产生了一定影响。
(3)而人均住房面积(X9)虽然也在一定程度上影响了城市房价,但影响程度要远低于直接反映城市居民经济水平的指标。
(4)居民消费指数(X3)对样本数据中城市房价产生的影响可以忽略不计。
结论
对于城市建筑商品房价格的影响因素,除了其决定的城市经济发展指标较多外,为了建立更标准的模型,需要利用更多的城市样本数据,而且城市商品房价格与城市发展指標间的关系可能不是单纯的线性关系。为了解决以上问题,我们通过引入非线性主成分分析法,将决定房价的多个指标因素化为了少数几个综合指标,相比于传统的主成分分析法,既能在尽可能多地保留原是变了信息并相互独立的同时,也减少了主成分的个数,提高了分析和计算的准确性。最后将非线性主成分分析后的综合指标进行了多元线性回归,拟合程度与检验结果符合预期。将主成分与原始变量间关系方程带入后的回归方程结果,可以分析出原始城市经济发展指标对于城市建筑商品房价格的影响程度,并且对根据城市经济发展指标进行房价估计有一定的预测作用。本文所介绍的基于多元统计分析方法的综合评价体系可以较好地适用于城市房价影响因素重要性的判断,同时对于其他实际生活或科研中多指标因素决定的问题有一定的适用性。
参考文献
[1]Abraham B. and J.Ledolier. Statistica l for Forecasting. New York:1983.
[2]张祟甫,陈述云.成分数据主成分分析及其应用[J].数理统计与管理, 1996( 4).
[3]邹渊渊,伍岳庆,姚宇.基于主成分和回归分析的烟叶质量分析模型[J].计算机应用,2011年z2期.
[4]彭鲁凤.城市住宅价格空间分异的模式和原因—对杭州的实证分析[D].浙江大学硕士论文,2010-01-01.
[5]韦国坚.上海市城市住宅价格空间分异实证研究[D].浙江大学硕士论文,2013-05-01.
关键词: 多元统计分析;非线性主成分分析;多元回归分析;城市建筑价格影响因素
引言
城市的建筑产品是一种异质性商品,建筑产品在决定使用价值的各个因素上面会有明显的差异,如城市的人口、经济发展指标和建筑面积等因素都与城市建筑商品房均价有一定的关联。对于众多影响因素,指标数量过多会使课题的复杂性加大。我们希望可以通过较少的指标个数得到的比较多的信息量。主成分分析对数据指标数目的降维将使得问题更为简单方便。[1]
而且由于建筑价格影响因素可能是非线性的,所以我们也将非线性主成分分析法与传统主成分方法进行比较,并结合多元线性回归分析和spss软件,对城市建筑商品房均价建立非线性的综合评价体系模型。
1综合评价体系的多元统计分析方法概述
1.1城市经济发展指标的主成分分析
对于决定建筑商品房价格的城市经济发展指标,指标之间有一定的关联性,可以理解为这两个指标之间对于决定建筑商品房价格的信息有一定的重叠。主成分分析是数学中的一种降维方法,它可以根据实际的需求把原来的指标重新组合成一组新的相互间线性无关的综合指标,也就是从其中抽取出少数几个主成分,这些主成分将尽可能多地表达原始变量的信息。通过对多个城市建筑样本和城市发展指标数据的压缩、解释,它也可以用来寻找影响城市商品房价格的综合指标,然后适当地说明综合指标所涵盖的信息意义,以便于更加清晰地了解问题的内在发展规律。
1.2非線性主成分分析
主成分分析法只能处理线性问题,实际问题例如城市建筑商品房影响因素这一问题中,不仅变量间有可能会有非线性的关系,而且主成分和原始变量间也存在着非线性的关系。此时如果只是进行线性化数据处理,必然影响研究结果的准确度。
非线性主成分分析法的方法有很多种[2],而在这之中,“对数中心化”是其中较为实用的一种的方法。
设有n个城市,p个经济发展指标。
(1)首先对原始指标的数据做对数中心化数据变换:
(2)计算对数中心化后的数据的样本协方差矩阵
(3)利用样本协方差矩阵S 求原始数据的主成分。设它们的特征值为λ1 ≥λ2 ≥… ≥λp ≥0 并且这些特征值相应的特征向量为ep,从而得到主成分为
剩下的步骤和传统线性的主成分分析方法一样。
与传统的主成分分析相比,非线性的主成分分析法有2处提高: 1.原始指标通过对数中心化这一变换,主成分被表示为原始变量的非线性组合;2.非线性的主成分分析法的出发点不再是相关系数矩阵,而是协方差矩阵。这两处提高将会使用较少的主成分反映更多的原始变量的信息,从而大大地提高数据降维的效果。
1.3主成分的多元回归分析
本文中的实例应用中我们将以城市建筑商品房价格Y为因变量,主成分F1,F2,…,Fk为自变量,利用线性回归方程方法可以建立综合评价体系的数学方程模型:
将主成分F1,F2,…,Fk的表达式,就能得到综合评价体系模型。
2建筑价格综合评价体系的数据收集与计算过程
我们搜集了中国统计年鉴2015年的统计数据,根据相关领域的研究,依据全面性、系统性、可比性、科学性和可取得性的原则[5],选择了中国35个主要城市建筑商品房价格受到的城市经济发展指标影响因素如下:总人口(X1),人均gdp(X2),居民消费指数(X3),人均公共财政收入(X4),人均公共财政支出(X5),平均工资(X6),人均消费品零售额(X7),人均居民储蓄存款(X8),人均住房面积(X9),建筑造价(X10)。
3综合评价体系的最终构建过程与结果分析
3.1非线性主成分分析与传统主成分分析的结果对比
我们在多元统计分析的数据搜集和分析时,往往需要收集到不同量纲的数据,比如总人口(万人),人均gdp(元)。我们已经对《中国统计年鉴》城市经济指标数据标准化,得到了标准化矩阵。
(1) 利用对数中心化的方法对城市经济发展的原始指标数据进行处理。
(2) 对对数中心化处理后的样本(lnXij)的协方差矩阵进行非线性的主成分分析。相关系数矩阵计算出的特征值及其累积贡献率见表1。
非线性主成分分析与普通线性主成分分析的特征值及累积贡献率的对比结果如下表所示:
由上表可以看出,非线性主成分分析的第一主成分比传统主成分分析法所携带的信息量高了13个百分点,非线性主成分分析法的前2个主成分的累计贡献率超过了90%,而传统方法前5个主成分才能超过90%,非线性主成分分析法可以用更多的主成分提取较多的原始指标信息,所以非线性主成分分析法更加适用于分析城市建筑商品房价格的影响指标因素。
根据贡献率大于85%原则,提取前2个特征值为主成分,进一步分析非线性主成分载荷矩阵得出[a1,a2]。进一步计算出主成分的特征向量[t1,t2]。 主成分和原指标之间的关系式,可以通过主成分的载荷矩阵求出。
表2中的系数为aij,主成分和原指标之间的关系式分别为:
主成分:
3.2非线性主成分分析的回归模型
分别将原始指标数据对数中心化后的数据lnXij代入方程,求得Fi( i = 1,2,3,4) ,然后将Fi当作自变量,将各城市商品房销售均价Y的对数中心化数据lnY作为因变量,回归方程的系数矩阵如下:
由表3可以得出回归系数估计值为:β1=8769.800得到城市商品房销售价格的回归方程:
式中: lnY 为商品房销售价格的标准化数据; Fi为各主成分的值,i = 1,2,3.
把式带入方程:
原始指标数据在回归模型方程中的系数以及标准化后的系数如下表:
因此反映城市经济发展指标与商品房价格关系的回归模型标准化方程为:
其中,βk为表5中回归方程系数。
3.3模型分析
通过对数中心化的数据lnY与lnX的多元回归方程可以看出城市经济指标对于城市建筑价格的影响程度,继而分析出其中间的关系。
多元回归分析的假设检验结果如表4,由表中可以得出判定系数为0.736,回归方程的拟合程度较好。F值为44.572,显著度为0.000,表明回归极显著。
同时,由表5中标准化后的系数对比可以看出,城市经济发展指标对于房价的影响可以分为以下四个等级:
(1)人均gdp(X2),人均公共财政收入(X4),人均公共财政支出(X5),人均消费品零售额(X7),人均居民储蓄存款(X8)的系数均大于0.3,这说明这些城市的经济指标很大程度上决定了城市商品房平均价格。
(2) lnX1,lnX6,lnX10所对应的原始数据中城市经济指标总人口(X1),平均工资(X6),建筑造价(X10)的系数在0.1左右,他们作为城市经济指标对于城市建筑商品房的价格也产生了一定影响。
(3)而人均住房面积(X9)虽然也在一定程度上影响了城市房价,但影响程度要远低于直接反映城市居民经济水平的指标。
(4)居民消费指数(X3)对样本数据中城市房价产生的影响可以忽略不计。
结论
对于城市建筑商品房价格的影响因素,除了其决定的城市经济发展指标较多外,为了建立更标准的模型,需要利用更多的城市样本数据,而且城市商品房价格与城市发展指標间的关系可能不是单纯的线性关系。为了解决以上问题,我们通过引入非线性主成分分析法,将决定房价的多个指标因素化为了少数几个综合指标,相比于传统的主成分分析法,既能在尽可能多地保留原是变了信息并相互独立的同时,也减少了主成分的个数,提高了分析和计算的准确性。最后将非线性主成分分析后的综合指标进行了多元线性回归,拟合程度与检验结果符合预期。将主成分与原始变量间关系方程带入后的回归方程结果,可以分析出原始城市经济发展指标对于城市建筑商品房价格的影响程度,并且对根据城市经济发展指标进行房价估计有一定的预测作用。本文所介绍的基于多元统计分析方法的综合评价体系可以较好地适用于城市房价影响因素重要性的判断,同时对于其他实际生活或科研中多指标因素决定的问题有一定的适用性。
参考文献
[1]Abraham B. and J.Ledolier. Statistica l for Forecasting. New York:1983.
[2]张祟甫,陈述云.成分数据主成分分析及其应用[J].数理统计与管理, 1996( 4).
[3]邹渊渊,伍岳庆,姚宇.基于主成分和回归分析的烟叶质量分析模型[J].计算机应用,2011年z2期.
[4]彭鲁凤.城市住宅价格空间分异的模式和原因—对杭州的实证分析[D].浙江大学硕士论文,2010-01-01.
[5]韦国坚.上海市城市住宅价格空间分异实证研究[D].浙江大学硕士论文,2013-05-01.