论文部分内容阅读
[摘要] 房地产市场的区域分类是进行房地产微观市场分析和宏观市场研究的基础。只有进行了合理有效的区域分类,才有可能对房地产市场行为有清晰的把握和认识。本文基于房地产市场发展规模的各项指标,运用聚类分析方法进行了全国房地产市场的整合分类,为合理划分全国市场提供了一个好的思路。
[关键词] 房地产市场 聚类分析 区域分类
一、引言
房地产的区域分类定应该以什么为标准?这个问题是进行房地产宏微观研究的根本基础。只有在对房地产区域进行了合理的细分,才能针对各个市场的各个物业市场进行进一步的探讨,才有可能正确解释和预测各个区域内宏观环境变化和微观机制运作给市场带来的影响。我国是一个面积广阔的国家,合理地进行区域的细分更显重要。因此,对我国房地产区域进行合理的范围细分是十分必要的。
二、房地产市场区域细分方法
房地产的区域划分实际上就是房地产的空间聚合问题。简单而言,也就是如何对地理观念上的整个房地产市场进行分割,使其成为多个独立的小区域。再通过对各个小区域的指标变量进行深入分析,得出各个独立区域的内在关联性。根据其间内在关联程度将独立区域重新聚合,进一步形成新的,独立性更强的,面积范围更大的市场区间。
房地产区域细分问题的关键和难点在于各个独立小区域的重新整合。整合工具变量的选取直接决定了区域重新整合的结果。在这一点上,国内外专家学者提出了不同的看法。各个国家的具体实行措施也截然不同。
美国人口普查局进行市场调查是以大都市统计区(MSAs)为依据的。这是一个基于数据的联邦划分标准,它通常包括一个人口在50000以上的建制县和至少一个的外围县。它的基本划分依据是区域内的流动性。这种方法最重要的特点是,在每一个区域单位内部,劳动力在地理位置上可以自由流通迁徙,而不受工作单位地理位置的影响。
我国现阶段房地产市场的划分是以地理位置和行政区域单位为标准的。根据中国统计年鉴,以直辖市,省,自治区为单位将全国房地产统计单位分成31个区域单位。这种方法是延续了行政建制的特点,显然在经济领域有严重的弱点。中国地域广大,生产力发展不平衡。经济改革遵循循序渐进的方法步步推进,没有在全国范围一次性铺开。这就导致中国各个行政区域经济发展的不平衡性。即使是相邻的省份,经济状况也有相当的差距。以此为基础对房地产市场进行区域分割显然是不能合理体现市场发展特点的。
但是,中国传统的定居观念使得中国居民不具有西方人的流动传统,在购买固定居所后,居民很难进行大范围的工作迁徙。这就使得中国居民流动性大大弱于美国。其次,中国人口众,人口密度大,交通相对落后,迁徙的成本要大大高于西方国家。另外,中国特有的户籍制度也大大限制了人员的流动。在缺少流动性的前提条件下,中国显然不能实行大都市统计区的区域划分方法。
在本文,笔者提出了中国房地产市场区域划分的新思路。简单而言,就是将多元数理统计方法运用到实际操作中。选取反映房地产市场发展状况的重要指标,在31个行政区划分的基础上,采用聚类分析方法对31个地区进行深入分析,进一步整合区域划分范围,以便能更好地分析区域的房地产微观市场行为,更有针对性地对不同区域进行宏观调控。
三、聚类分析方法原理和方法
聚类分析是一种多元数理统计方法。它并没有事先设定样本分类的标准,而是通过对样本和变量数据的不同特征指标值进行差异程度计算,根据变量或样本间不同的差异程度大小重新结合分类,产生一个更有效的类族。在这个类族中,每一个新类别中的原样本或变量在一定程度上更为接近。它的关键在于计算个体之间的“亲疏程度”,也就是个体之间的差异程度,这可以通过计算个体间的距离来实现。分析个体间的“亲疏程度”就是通过各种方法计算个体间的距离。得出的距离越小,意味着个体越“亲密”,反之,则越“疏远”。根据个体“亲疏程度”,可以对所有样本进行重新整合,越“亲密”的个体越有条件合为一类,越“疏远”的个体则容易被归为不同类别。
中国房地产市场区域聚类分析中国地缘辽阔,生产力和生活水平地域性差距大,房地产市场也由此呈现明显的区域特点,而这种区域特点又和单纯地理位置或行政区域导致的地域差异明显不一致。
根据中国统计年鉴2006年发布的2005年全国31个直辖市、省、自治区房地产数据,本文选取房地产开发企业基本情况、房地产开发经營情况、商品房销售情况、房地产开发建设投资总规模及完成投资、房地产开发企业资金来源、房地产开发建设房屋建筑面积和造价、房地产开发企业土地开发及购置七个大类的26个指标进行数据分析,分别是开发公司个数、职工人数、经营总收入、土地转让收入、商品房屋销售收入、房屋出租收入、营业收入、实际销售商品房屋面积、住宅销售面积、商品房屋销售额、住宅销售额、商品房屋平均销售价格、住宅销售平均价格、实际需要总投资、本年完成投资额、本年资金来源小计、国内贷款、利用外资、自筹资金、施工房屋面积、竣工房屋面积、竣工房屋面积、本年新开工房屋面积、竣工房屋造价、本年完成开发土地面积、土地购置费用、本年购置土地面积。由于指标较多,地区划分单位相对较细,我们很难从提供数据中直观地看出各地区房地产市场发展规模的区别,更谈不上很有效地对各地区市场进行针对性的政策调控。为了更好地对特定地区进行房地产市场监控和市场研究,有针对性地制定宏观政策进行指导和调控,就很有必要对全国市场进行重新整合分类。
聚类分析中距离的计算按照计算参加对象分为两种:个体间距离的计算和个体与小类、小类与小类间距离的计算。近年来,学者们针对这两种距离计算提出了众多方法。本文采用平方欧式距离(Squared Euclidean distance)计算个体间距离,用组间平均链锁(Beteween-groups linkages)距离计算个体与小类,小类之间距离。
平方欧式距离是两个个体(x,y)间所有指标变量之差的平方和,数学定义为:
(1)
其中,xi代表个体x第i个变量的值;yi代表个体y第i个变量的值;k代表所有的变量数目。
组间平均链锁距离是指该个体与小类中各个个体距离的平均值,数学定义为:
(2)
其中,x是小类外的个体;Y代表小类,其中包含k个个体; 代表小类中第i个个体。
经过聚类分析计算,SPSS软件生成了聚类分析凝聚状态表,聚类分析冰挂图和树形图。通过观察这三个表格,我们就可以从不同的层次聚类过程得到全国房地产市场区域分类整合的多解。
结果显示,全国房地产市场聚类分析可以得到多个分类结果。例如,当分成6类时,北京单独一类;上海,广东一类;江苏,浙江一类;天津,四川和福建一类;山东,辽宁一类,剩余地区归为一类。当分为5类时,可将辽宁,山东,天津,四川和福建合并一起。分为4类时,可进一步将北京与上海,广东合为一类。考虑到最大类别包含了18个个体,个体数目偏多,不容易区分该类省市间差异,因此对该类别继续进行相同方法的聚类分析,得到相应结果(见附表1)。
通过两个阶段的聚类分析,我们最终确定全国房地产市场区域分类为7个小类。
A类:上海、广东、北京
B类:浙江、江苏
C类:辽宁、山东、福建、四川、天津
D类:安徽、湖北、河北、河南,湖南、重庆
E类:广西、云南,江西,陕西,黑龙江
F类:山西、贵州、内蒙古、吉林
G类:海南、宁夏、甘肃、新疆、青海、西藏
进一步分析各个类的统计特征(见附表2):
可以发现,各组的指标均值大多由A类到G类依次递减。
A类为房地产市场最为发达的区域,该地区总面积远小于其他地区,但除本年完成投资额,竣工房屋面积,本年购置土地面积三个指标略不及B类地区外,其他均保持领先地位。这说明A类地区房地产市场活跃,盈利能力强。B类地区在各项指标都高于C类地区,表明该地区市场总体表现强于C类地区,亦属于全国房地产市场的指标地区,需要重点关注。F类区域和G类区域各个指标明显弱于其他区域,无论是市场规模还是盈利能力都需要大力提升。这两个地区都需要政府给于特殊政策加以扶持,保证房地产市场的顺利发展。而D类地区和E类区域较为接近,各项指标都处于中游地位。
四、结论
本文用聚类方法根据房地产行业的各项指标进行距离计算,更为合理地对全国房地产市场重新整合分类。但是这种区域分类方法不是一劳永逸的。如果在若干年限间隔(比如三年)就进行一次系统的聚类分析,还能使得我们对全国各地市场的发展变化有更直观的了解。需要提出的是,目前聚类分析只能对单个时点的若干指标或单个指标的时间序列进行分析,显然具有一定的片面性。关于多个指标的时间序列聚类分析问题,仍然需要进一步的探索和研究。
参考文献:
[1]Denise.Dipasquale and William C.Wheaton,龙奋杰译:城市经济学与房地产市场.2002年:经济科学出版社
[2]Ramsay J.O. and Silverman B.W. Functional Data Analysis [M].New York:Springer-Verlag New York,Inc,1997,11~83
[3]Tae-kyung Kim. Exploring spatial effects on urban housing duration. Environment and Planning A, 2003, 35: 1415~1429
[关键词] 房地产市场 聚类分析 区域分类
一、引言
房地产的区域分类定应该以什么为标准?这个问题是进行房地产宏微观研究的根本基础。只有在对房地产区域进行了合理的细分,才能针对各个市场的各个物业市场进行进一步的探讨,才有可能正确解释和预测各个区域内宏观环境变化和微观机制运作给市场带来的影响。我国是一个面积广阔的国家,合理地进行区域的细分更显重要。因此,对我国房地产区域进行合理的范围细分是十分必要的。
二、房地产市场区域细分方法
房地产的区域划分实际上就是房地产的空间聚合问题。简单而言,也就是如何对地理观念上的整个房地产市场进行分割,使其成为多个独立的小区域。再通过对各个小区域的指标变量进行深入分析,得出各个独立区域的内在关联性。根据其间内在关联程度将独立区域重新聚合,进一步形成新的,独立性更强的,面积范围更大的市场区间。
房地产区域细分问题的关键和难点在于各个独立小区域的重新整合。整合工具变量的选取直接决定了区域重新整合的结果。在这一点上,国内外专家学者提出了不同的看法。各个国家的具体实行措施也截然不同。
美国人口普查局进行市场调查是以大都市统计区(MSAs)为依据的。这是一个基于数据的联邦划分标准,它通常包括一个人口在50000以上的建制县和至少一个的外围县。它的基本划分依据是区域内的流动性。这种方法最重要的特点是,在每一个区域单位内部,劳动力在地理位置上可以自由流通迁徙,而不受工作单位地理位置的影响。
我国现阶段房地产市场的划分是以地理位置和行政区域单位为标准的。根据中国统计年鉴,以直辖市,省,自治区为单位将全国房地产统计单位分成31个区域单位。这种方法是延续了行政建制的特点,显然在经济领域有严重的弱点。中国地域广大,生产力发展不平衡。经济改革遵循循序渐进的方法步步推进,没有在全国范围一次性铺开。这就导致中国各个行政区域经济发展的不平衡性。即使是相邻的省份,经济状况也有相当的差距。以此为基础对房地产市场进行区域分割显然是不能合理体现市场发展特点的。
但是,中国传统的定居观念使得中国居民不具有西方人的流动传统,在购买固定居所后,居民很难进行大范围的工作迁徙。这就使得中国居民流动性大大弱于美国。其次,中国人口众,人口密度大,交通相对落后,迁徙的成本要大大高于西方国家。另外,中国特有的户籍制度也大大限制了人员的流动。在缺少流动性的前提条件下,中国显然不能实行大都市统计区的区域划分方法。
在本文,笔者提出了中国房地产市场区域划分的新思路。简单而言,就是将多元数理统计方法运用到实际操作中。选取反映房地产市场发展状况的重要指标,在31个行政区划分的基础上,采用聚类分析方法对31个地区进行深入分析,进一步整合区域划分范围,以便能更好地分析区域的房地产微观市场行为,更有针对性地对不同区域进行宏观调控。
三、聚类分析方法原理和方法
聚类分析是一种多元数理统计方法。它并没有事先设定样本分类的标准,而是通过对样本和变量数据的不同特征指标值进行差异程度计算,根据变量或样本间不同的差异程度大小重新结合分类,产生一个更有效的类族。在这个类族中,每一个新类别中的原样本或变量在一定程度上更为接近。它的关键在于计算个体之间的“亲疏程度”,也就是个体之间的差异程度,这可以通过计算个体间的距离来实现。分析个体间的“亲疏程度”就是通过各种方法计算个体间的距离。得出的距离越小,意味着个体越“亲密”,反之,则越“疏远”。根据个体“亲疏程度”,可以对所有样本进行重新整合,越“亲密”的个体越有条件合为一类,越“疏远”的个体则容易被归为不同类别。
中国房地产市场区域聚类分析中国地缘辽阔,生产力和生活水平地域性差距大,房地产市场也由此呈现明显的区域特点,而这种区域特点又和单纯地理位置或行政区域导致的地域差异明显不一致。
根据中国统计年鉴2006年发布的2005年全国31个直辖市、省、自治区房地产数据,本文选取房地产开发企业基本情况、房地产开发经營情况、商品房销售情况、房地产开发建设投资总规模及完成投资、房地产开发企业资金来源、房地产开发建设房屋建筑面积和造价、房地产开发企业土地开发及购置七个大类的26个指标进行数据分析,分别是开发公司个数、职工人数、经营总收入、土地转让收入、商品房屋销售收入、房屋出租收入、营业收入、实际销售商品房屋面积、住宅销售面积、商品房屋销售额、住宅销售额、商品房屋平均销售价格、住宅销售平均价格、实际需要总投资、本年完成投资额、本年资金来源小计、国内贷款、利用外资、自筹资金、施工房屋面积、竣工房屋面积、竣工房屋面积、本年新开工房屋面积、竣工房屋造价、本年完成开发土地面积、土地购置费用、本年购置土地面积。由于指标较多,地区划分单位相对较细,我们很难从提供数据中直观地看出各地区房地产市场发展规模的区别,更谈不上很有效地对各地区市场进行针对性的政策调控。为了更好地对特定地区进行房地产市场监控和市场研究,有针对性地制定宏观政策进行指导和调控,就很有必要对全国市场进行重新整合分类。
聚类分析中距离的计算按照计算参加对象分为两种:个体间距离的计算和个体与小类、小类与小类间距离的计算。近年来,学者们针对这两种距离计算提出了众多方法。本文采用平方欧式距离(Squared Euclidean distance)计算个体间距离,用组间平均链锁(Beteween-groups linkages)距离计算个体与小类,小类之间距离。
平方欧式距离是两个个体(x,y)间所有指标变量之差的平方和,数学定义为:
(1)
其中,xi代表个体x第i个变量的值;yi代表个体y第i个变量的值;k代表所有的变量数目。
组间平均链锁距离是指该个体与小类中各个个体距离的平均值,数学定义为:
(2)
其中,x是小类外的个体;Y代表小类,其中包含k个个体; 代表小类中第i个个体。
经过聚类分析计算,SPSS软件生成了聚类分析凝聚状态表,聚类分析冰挂图和树形图。通过观察这三个表格,我们就可以从不同的层次聚类过程得到全国房地产市场区域分类整合的多解。
结果显示,全国房地产市场聚类分析可以得到多个分类结果。例如,当分成6类时,北京单独一类;上海,广东一类;江苏,浙江一类;天津,四川和福建一类;山东,辽宁一类,剩余地区归为一类。当分为5类时,可将辽宁,山东,天津,四川和福建合并一起。分为4类时,可进一步将北京与上海,广东合为一类。考虑到最大类别包含了18个个体,个体数目偏多,不容易区分该类省市间差异,因此对该类别继续进行相同方法的聚类分析,得到相应结果(见附表1)。
通过两个阶段的聚类分析,我们最终确定全国房地产市场区域分类为7个小类。
A类:上海、广东、北京
B类:浙江、江苏
C类:辽宁、山东、福建、四川、天津
D类:安徽、湖北、河北、河南,湖南、重庆
E类:广西、云南,江西,陕西,黑龙江
F类:山西、贵州、内蒙古、吉林
G类:海南、宁夏、甘肃、新疆、青海、西藏
进一步分析各个类的统计特征(见附表2):
可以发现,各组的指标均值大多由A类到G类依次递减。
A类为房地产市场最为发达的区域,该地区总面积远小于其他地区,但除本年完成投资额,竣工房屋面积,本年购置土地面积三个指标略不及B类地区外,其他均保持领先地位。这说明A类地区房地产市场活跃,盈利能力强。B类地区在各项指标都高于C类地区,表明该地区市场总体表现强于C类地区,亦属于全国房地产市场的指标地区,需要重点关注。F类区域和G类区域各个指标明显弱于其他区域,无论是市场规模还是盈利能力都需要大力提升。这两个地区都需要政府给于特殊政策加以扶持,保证房地产市场的顺利发展。而D类地区和E类区域较为接近,各项指标都处于中游地位。
四、结论
本文用聚类方法根据房地产行业的各项指标进行距离计算,更为合理地对全国房地产市场重新整合分类。但是这种区域分类方法不是一劳永逸的。如果在若干年限间隔(比如三年)就进行一次系统的聚类分析,还能使得我们对全国各地市场的发展变化有更直观的了解。需要提出的是,目前聚类分析只能对单个时点的若干指标或单个指标的时间序列进行分析,显然具有一定的片面性。关于多个指标的时间序列聚类分析问题,仍然需要进一步的探索和研究。
参考文献:
[1]Denise.Dipasquale and William C.Wheaton,龙奋杰译:城市经济学与房地产市场.2002年:经济科学出版社
[2]Ramsay J.O. and Silverman B.W. Functional Data Analysis [M].New York:Springer-Verlag New York,Inc,1997,11~83
[3]Tae-kyung Kim. Exploring spatial effects on urban housing duration. Environment and Planning A, 2003, 35: 1415~1429