论文部分内容阅读
摘要:随着我国经济的高速发展,房价尤其是以一线城市为代表也随之有了飞速的抬升,以上海为例,过去的二十年内上海市的房价几乎是以翻倍的速度增长,时至今日也丝毫没有停止增长的态势。而本文就将对上海地区房屋价格影响因素进行分析。本文随机抽取了40间房屋的样本数据,从面积,地段,年限等十四个变量进行分析,使用eviwes软件对数据进行整理得出多元线性回归模型,并对其赋予经济意义。
关键词:房屋价格横截面数据多重线性回归
Research on impact of Shanghai District’s housing price
Abstract: With the rapid development of China's economy,especially in the first-tier cities as the representative also has a rapid uplift.Taking Shanghai as example,in the past twenty years,the price of house have almost doubled,and still keeping increasing today.In this article, we randomly selected 40 samples.By analying 14 different variables like house area,location,floor life and so on,useing the eviwes softwore to organie the data and get the multivariate regression model.And give the model economic significance.
Key words:housing price; multiple linear regression; cross-sectional data
1.文獻綜述
在过去的近十年内,随着中国经济的飞速发展,中国一线城市的的房价也同样处于飞速发展的态势。而其中最具有代表性的城市无疑是上海了。在过去2005年到2015年间,上海的房价每年都在以震荡式的速度增加,从2005年的平均每平米8164元,到2014年平均每平米26980元,十年间增长了3倍多,造成这一现象的直接原因是上海住房资源处于严重的供不应求状态。国家颁布了建设用地红线,在2020年之前上海建设用地不得超过3185平方公里,但是在2016年就已经达到了3124平方公里,仅剩61平方公里。这意味着在未来的几年内上海几乎不会再有新的土地供应,只能依靠城市拆迁改造获得新的土地资源,这无疑增加了原本就十分高昂的土地成本。所以房价还会继续上涨。对于大多数人而言,新房的性价比显然不高。就是在房价这飞速发展的近十几年内,尽管二手房起步较晚,但是发展却非常的迅速。因此本次笔者的调查选取的数据都是采用的上海地区的二手房的数据。本文在此并未考虑影响二手房价格的宏观因素,而是建立在特征模型的基础之上,仅仅把房屋看成一种商品,考察房屋自身的属性对于其价格的影响。对房屋的单价进行多元线性回归,并对结果进行统计检验。除此之外我们将得出影响二手房价格的主要因素,让消费者的选择更加具有目的性。鉴于我们分析的对象是二手房,在链家网挂牌的上海地区二手房有将近9万套,适合作为统计总体。
高文林[1](2012)在《二手价格评估的影响因素及方法选择》一文中将二手房的评估因素分为四类,区位因素,建筑因素,房屋征收因素以及经济环境因素。其中将区位因素以及建筑因素认为是影响二手房房屋价格的最重要的因素。除此之外则是宏观调控和大环境等因素对二手房价格产生波动。
丁战、孙国庆[2](2007)在《剖析选购二手房的影响因素》一文中,在不考虑宏观经济因素的条件下,单独分析二手房的特征。将影响因素分成了房屋自身,周边环境以及中介三个方面。利用判断矩阵对于所有得到的数据进行排序,认为方便的地段会便于年轻人日常工作和休闲出行。
朱寿佳、甄封。秦萧、何伊伊[3](2015在)《基于核密度估计的南京二手房活跃度特征及影响机制研究》一文中提及到,未来研究居住空间热点主要集中在居住空间社会视角,住宅郊区与土地资源及居民住宅区位选择的微观机制方面,其中,居民选择新房、二手房、租房的住房类型行为则较为复杂。因而,单从一种住房类型(如二手房)下手,能较为深入研究住房选择行为。选取数据时,通过网络数据研究二手房更能反映住房市场状况。
2.变量的选择
我们在链家网上随机选取了40组二手房的数据,而收集到的关于价格影响因素的变量大致分为以下几种。
2.1第一类为房屋的地段
根据前文提到的参考文献,人们选择房屋的时候首要考虑的因素是房屋地段,一个优良的地段往往能给房屋带来很高的增值。而我们重点关注的与地段相关的因素主要分为以下几个方面:(1)第一是房屋所处地到达市中心的距离。这里使用南京东路作为市中心,因为这个地段被认为是上海地区最为繁荣的地段。房屋距离市中心越近人们出行会方便许多,出行时间也会相应的缩短。(2)第二是房屋所处环线,在上海地区,环线将城市分为了几个部分。内环以内属于市中心城区,中环以内属于城市快速通道,外环的是属于免费通行的高速公路。同样是可以确认的是环线越内出行越方便,出行花费的时间越少。(3)作为一线大都市,上海市最为重要的交通工具非地铁莫属。有句话说到好,‘上海地区地铁停运一个白天,整个上海完全陷入瘫痪状态。’在这样的大环境下产生地铁房这一特殊的房屋类型,同样区段的房屋,与地铁站距离越近的,出行会方便很多。
2.2房屋的自身因素 第一个大类中的因素主要是人们根据自身的出行需要对房屋的要求,这些因素是房屋所处地段所带来的外界因素,并不属于房屋本身的因素。而除此之外最重要的因素则是房屋本身所具备的属性,即房屋的建筑性因素。我们搜集到的数据主要将房屋的建筑性因素分为以下几类:(1)第一类因素是房屋的面积,衡量一间房屋自身的因素最为重要的便是房屋的面积。根据边际效用递减理论,当人们对于房屋面积的需求没那么紧迫时,更大的面积带来的效用偏低,因此当人们不需要那么大的面积时,往往会更偏向于选择较小的房屋。(2)第二类因素是房屋的户型,房屋的户型主要是以房屋的客厅数目与卧室数目进行衡量,该因素与房屋的面积有很大程度上的挂钩。因此我们在整理数据时,都使用的是卧室的数目来衡量户型这一变量。(3)第三类因素是房屋所在楼层的高度,这一属性对房屋价格的影响毋庸置疑,房屋所处的楼层偏高,对于人们的日常出行会造成诸多的不便,且这种情况在没有电梯的楼层将会更加的显著。而除了日常出行之外,在人們遭遇意外事故或者灾难比如火灾或者地震时,较低楼层的住户肯定比较高楼层的住户更容易逃生,遭受的经济损失通常也更少。因此我们几乎可以预见较低楼层的房屋价格会高于较高楼层的房屋价格。(4)第四类因素是房屋的朝向,在我们可以搜集到的数据中,房屋朝向一共分为东西南北和南北通五个大类,其中南北通类房屋因为其采光良好,通风流畅,在同等条件下会优于前四种类型。(5)第五类因素是房屋的年限,一栋楼层它的使用年限越久,楼层中出现各种问题的可能性就会增加,同样的我们还需要更多的花费进行维护。因此在同等条件下,人们会更傾向于选择一栋年限较短的房屋。(6)鉴于我们搜集的数据全部来源于二手房,因此数据中会存在一些新房不具备的属性,第六类因素是二手房的装修程度。众所周知,一栋房屋必须是要经过装修才能入住,势必是装修程度越好,房屋价格越高。
2.3第三类为房屋的附加属性
第二个大类中的属性是所有房产几乎都通用的特性。而第三大类中包含了房子一些附加的属性。(1)房屋使用年限。当我们选择二手房时,满二和满五经常出现在房屋的特性中,满五即房屋使用满五年,满二同理。满五的房屋可以减免营业税(后改为增值税)和个人所得税,而满二则只减免营业税,个人所得税依旧需要上交。(2)有无电梯,根据前文提到的房屋楼层对于住户的影响,对于楼层较低的住户而言有无电梯影响较小,但是对于楼层较高的用户电梯会显得十分重要。(3)有无钥匙,该条件主要是涉及到房屋的安全防盗问题。(4)是否有阳台,阳台一般会使房屋采光较好,且有许多其他方便的功能。
3.数据的整理以及模型的建立。
根据上文的描述,我们对变量进行了整理,如表1
对于定量变量我们都直接采用了链家网上面给定的数据,而对于定性变量,我们将其根据不同的水平进行评级打分进而将其量化。比如房屋装修水平我们分为01234五个水平进行评级,而房屋户型我们则直接以卧室的数量进行衡量。而房屋朝向我们则以南北通为3分,朝南为2分,朝其他方位为1分进行评判。我们选取的数据中一共存在有十四组变量,因此最终的模型中会存在明显的多重共线性,我们在采取了逐步回归的方法之后一共剩余了房屋楼层,房屋所在环线,房屋与市中心距离,装修程度,楼层年限5个变量。5个变量的描述统计结果如表2。
我们利用eviews软件对数据进行回归分析(设定显著性水平为10%),在此选择了简单线性回归模型,半对数回归模型和双对数回归模型三种,比较判断后选择了拟合优度较高的半对数回归模型。接着我们对得到的模型进行怀特检验,怀特R2统计量P值等于0.4191,远大于显著性水平的0.1,因此模型不存在异方差。最后对模型进行DW检验,结果DW统计量为1.754006,查阅DW统计量临界值表,k=5,N=40时,dL=0.997,dU=1.652。1.754006>1.652,因此模型不存在误差序列相关性。最终模型的回归结果如下:
经过了数据分析之后我们发现方程的决定系数R2等于0.772,调整系数为0.738,模型拟合度较为良好。所有变量的p值均小于显著性水平的10%,各个变量的t检验通过,F统计量p值远小于10%,说明模型的设立和变量的选择均具有较高的准确性。最终结果进入模型的变量有:楼层区间,房屋到市中心距离,房屋所处环线,装修程度和楼层年限。得出的回归方程为:Y=110837.1-2812.009Z3-601.7194X1-9477.875X3+1627.385Z6-5437.188lnZ5
4.对模型以及变量的解释
4.1 房屋地段
在回归模型中我们可以发现,我们得到的结果中房屋到市中心的距离以及房屋所处的环线这两个因素的相关性较高。但是房屋到地铁站的距离这一因素却相关性很低。造成这一现象的原因可能是,我们使用的数据房屋到达地铁站的距离,但是同等条件下距离地铁站距离相近的同等类型房屋之间区别度很小,而地铁房与非地铁房之间区别度又很大,因此最终我们进行线性回归时到地铁站距离这一项的相关性十分低,最终从模型中剔除。我们从模型中可以看出,房屋到市中心的距离每增加一公里,房屋的价格会减少约601元每平方米。而环线这一因素我们搜集到的数据一共有四种类型,分别是内环内,内中环,中外环,外环外。我们将四个类型分成四个级别按照1234进行打分评级,回归结果显示,房屋地段每往外延伸一个环线级别,房屋的价格会减少9477每平方米。从上述结果我们可以看出,房屋地段对于房屋价格具有非常显著的影响,与参考文献中提到的区位因素作为影响房价最为重要的因素相符合。造成该现象的原因笔者认为主要有以下几点:一、首先上海作为国际大都市,整个上海的面积是十分巨大的,因此通畅的交通对于人们而言非常的重要,当然出行的花费也同样的因为发达的交通而水涨船高。举一个最简单的例子,在这样的条件下,越靠近市中心的房屋日常交通开销会越少,自然会因此对房价产生很大的影响。二、即便上海市的交通系统已经到达了非常发达的地步了,但是由于其本身土地面积较大的缘故,导致地域间跨度十分大。例如地铁9号线,该站的起点站到终点站之间需要花费两个小时左右的车程,如果存在换乘可能还会花费更长的时间。而地铁已经是作为最方便的交通出行工具了,如果换成其他的交通工具那么还将会花费更多的时间。即越远离市中心的地区,出行所花费的时间会越长。三、同样也是因为交通的缘故,尽管地铁系统已经非常的发达,可以做到覆盖很大一部分市区,但是还有更大一部分地区处在地铁无法覆盖的地区,这些地方除了私家车之外最主要的交通工具就是公交车。这些地区的交通会因为没有地铁显得十分的拥堵,私家车出行也经常会受阻,而公交车也因为出行人数过大,在早晚高峰期会非常的拥挤,便利性远远比不上地铁。总而言之,在越远离市中心的地区,出行的难度也会随之直线上升。因此最终我们得出的结论是,同样的房屋条件下,房屋距离市中心越近,房屋越靠近内环,势必房屋的价格会上升的越厉害。而对于地铁房这一特殊类型,地铁房自然会比非地铁房价格高出一大截,但是同等区位条件下的,即同为地铁房或同为非地铁房时,与地铁站的距离并不能对房屋的价格造成多大的影响。 4.2 房屋的基本属性
我们在搜集数据时,寻找了户型,面积,楼层年限,装修程度,楼层高度以及房屋朝向6组变量,而最终得出的方程中,楼层高度,楼层年限以及装修程度的相关性较高。我们现在对这六组变量进行分析。首先是通过检验的变量(1)关于楼层年限,房屋的基础属性当中,楼层年限是影响程度最高的变量。我们最终的模型中得出的数据是,楼层年限每增加百分之一,房屋价格下降约5437元每平方米。采用对数模型的原因是由于相近年限下的房屋价格差异过小。大数据表明,房屋年限在大于二十年之后会存在明显的贬值,而我们搜寻的数据中价格较高的房屋楼层年限几乎都是在二十年以下的。房屋年限增加,楼层基础设施势必会存在老化的问题,维护费用将是一笔不小的数目,但是还远不及此,有的基础设施容易维护,比如墙壁电灯水管,但是有的基础设施维护难度较大,比如电路。维护难度较大的设施使用年限过长的话肯定会导致安全性下降,所以多数人都更加中意年限较短的。另一方面,城市规划往往是偏离较老的城区的,即楼层年限较长的房屋多数会更远离新建设开发的地区,导致地段偏差。在这里不采用简单线性回归的重要原因是满二与满五这一特殊因素的存在,该因素虽然最终没有进入回归方程,但是肯定会影响房屋价格,并该影响的趋势是年限越长价格越高,与楼层年限的影响趋势恰好相反。因此最终选择半对数模型。(2)房屋楼层这一因素由于不同的楼层高度不同,因此如果直接采用具体楼层数目作为原始数据进行回归显然不合理。所以我们并没有直接将楼层的高度作为原始数据,而是最后将楼层数据按低区中区高区三个区段按照一级二级三级进行评级。回归结果显示,楼层每上升一个区段,房屋价格下降约2812元每平方米。这一结果显然在情理之中,无论是日常起居,购置家电,以至于搬家等活动,楼层越高,上述行为操作起来的难度就会越大,这种现象特别是存在于没有电梯的楼房,操作难度更是直线攀升。同样的还有之前提到的意外事故发生时,较低的楼层往往更容易脱离危险,且遭受的经济损失往往也比较高楼层的住户更少。(3)结果显示装修程度越高,房屋价格越低,我们使用01234五个等级对于房屋装修程度进行评级,结果数据表明,评级每上升一个等级,房屋价格上升约1627元每平方米,原因可想而知,装修是房屋入住的基本条件,而装修程度越高,入住后相应的装修花费就会越少,甚至于不用装修即可入住。所以房屋的价格也随着装修程度的提高而提高。。再来是我们剔除的变量进行分析(1)房屋面积作为房屋最为重要的属性,在前文的分析中,看似理应成为重要的解释变量之一,但是我们选取的数据在上海地区,存在一个很重要的影响因素。在上海地区的房价毋庸置疑是全国最高的,且多数地段的价格也已经远远高出了很多非上海本地人可以接受的程度,最为直观的数据就是,在我们搜集的40组数据当中,最便宜一套房产的价格也达到了36674元每平方米,较之于一般的中小型城市每平米几千元的价格也是远远超出。因此房价过高必然会导致房贷压力重,最直接的影响就是人们购房是多数会选择较小的户型,我们搜集到的数据中最后得到的平均面积也只有不到80平米。同样的,在综述中提到的上海市土地建设用地红线,仅剩的61平方公里几乎无法利用,土地资源已经到达了极为紧张的地步,因此多数房屋都是属于小户型房屋。我们在链家网上可以寻找到挂牌的近9万套二手房产里面,小于90平米的房屋占据了一半以上。同樣的我们选取的40组数据也是多数在小于90平米。而小于90平米的房屋对于一般的三口之家而言只能算是够用而不是充裕,则不会存在前文数据搜集中笔者提到的由于房屋面积偏大而产生的边际效益递减现象。因此我们最终得到的结果里面不同数据之间区分度较小,导致最终的模型中房屋面积这一项的相关性较低,因此将该变量剔除。(2)我们研究户型时采用的是用房间数目对于这一变量进行衡量。毫无疑问户型该变量与房屋面积具有很高的相关性,而最终结果这一变量和房屋面积一样相关性较低。因为同样的原因,我们搜集到的平均面積在80平米左右的房屋,多数的数据都是两室一厅,因此最终该变量也同样的因为不同数据之间区分度过低剔除。(3房屋朝向这一因素最终没有进入我们的回归模型当中,同样是因为不同数据之间区分度过小的原因,链家网上近9万所房产,朝南和南北通的房屋分别是3.4万与3.8万,同样也反应在我们的数据当中,我们选择的数据也几乎没有朝东西北的房屋,因此最终剔除该变量。
4.3 房屋的附加属性
在我们最终得到的模型中,该大类并没有数据进入回归方程内。主要原因是,在我们找到的40组数据当中,几乎都是满五的房屋。因此在我们的样本之中很难界定出满五满二对于房屋价格的影响。同样的现象还发生在另外几个附加属性上,多数房产都有钥匙,多数房产都有阳台。而关于有无电梯该变量,该变量对最终结果有一定程度上的影响,但是最终由于T检验不合格剔除。造成该现象的原因笔者认为主要是不同高度楼层的住户对于电梯的需求度有很大的不同。诚然对于高层住户而言电梯是生活必备条件,但是对于多数低区住户而言,电梯的有无对于生活的影响微乎其微。因此最终该变量尽管对被解释变量有一定程度的影响,但是由于内部条件存在一定的矛盾使得结果误差偏离较大,导致最终的T检验未通过,因此从模型中剔除。
5.结语
本文基于特征分析方法以及多元线性回归模型分析了影响上海地区房屋价格的因素,总结为以下几点:
首先是房屋的地段,从模型中我们可以看出,房屋地段类因素对价格影响最大。而其中影响程度最高的是房屋所在环线。即现代人对房屋的需求开始转变,即日常生活以及休闲出行。
其次是房屋自身的基本属性,楼层高度和楼层年限占主要影响因素,在除了房屋的区位因素之外,可以看出人们选择房屋更偏向于房屋的安全性和便利性。除此之外因为是二手房,所有装修程度不可避免的成为了重要影响因素之一。而关于房屋朝向等影响人们日常生活舒适性的因素在如今快节奏的生活背景下开始显得没有那么重要。
关于房屋的一系列附加因素,这些因素或许会对房屋价格有一定的影响,因为这些附加因素多数房屋都涵盖了,并不能成为优势因素存在。以及电梯这一因素,由于自身存在一定的矛盾性因此也没有成为决定性因素。
参考文献:
[1]高文林.二手房价格评估的影响因素及方法选择[J]中国房地产2012.08
[2]丁战、孙国庆.剖析选购二手房的影响因素[J]经济论坛2007.02
[3]朱寿佳、甄封。秦萧、何伊伊.基于核密度估计的南京二手房活跃度特征及影响机制研究[J]地球信息科学报2015.06
[4]缪格、李英冰、袁菲.基于多元回归法的武汉市二手房价格影响因素的研究[J]城市勘测2017.01
关键词:房屋价格横截面数据多重线性回归
Research on impact of Shanghai District’s housing price
Abstract: With the rapid development of China's economy,especially in the first-tier cities as the representative also has a rapid uplift.Taking Shanghai as example,in the past twenty years,the price of house have almost doubled,and still keeping increasing today.In this article, we randomly selected 40 samples.By analying 14 different variables like house area,location,floor life and so on,useing the eviwes softwore to organie the data and get the multivariate regression model.And give the model economic significance.
Key words:housing price; multiple linear regression; cross-sectional data
1.文獻綜述
在过去的近十年内,随着中国经济的飞速发展,中国一线城市的的房价也同样处于飞速发展的态势。而其中最具有代表性的城市无疑是上海了。在过去2005年到2015年间,上海的房价每年都在以震荡式的速度增加,从2005年的平均每平米8164元,到2014年平均每平米26980元,十年间增长了3倍多,造成这一现象的直接原因是上海住房资源处于严重的供不应求状态。国家颁布了建设用地红线,在2020年之前上海建设用地不得超过3185平方公里,但是在2016年就已经达到了3124平方公里,仅剩61平方公里。这意味着在未来的几年内上海几乎不会再有新的土地供应,只能依靠城市拆迁改造获得新的土地资源,这无疑增加了原本就十分高昂的土地成本。所以房价还会继续上涨。对于大多数人而言,新房的性价比显然不高。就是在房价这飞速发展的近十几年内,尽管二手房起步较晚,但是发展却非常的迅速。因此本次笔者的调查选取的数据都是采用的上海地区的二手房的数据。本文在此并未考虑影响二手房价格的宏观因素,而是建立在特征模型的基础之上,仅仅把房屋看成一种商品,考察房屋自身的属性对于其价格的影响。对房屋的单价进行多元线性回归,并对结果进行统计检验。除此之外我们将得出影响二手房价格的主要因素,让消费者的选择更加具有目的性。鉴于我们分析的对象是二手房,在链家网挂牌的上海地区二手房有将近9万套,适合作为统计总体。
高文林[1](2012)在《二手价格评估的影响因素及方法选择》一文中将二手房的评估因素分为四类,区位因素,建筑因素,房屋征收因素以及经济环境因素。其中将区位因素以及建筑因素认为是影响二手房房屋价格的最重要的因素。除此之外则是宏观调控和大环境等因素对二手房价格产生波动。
丁战、孙国庆[2](2007)在《剖析选购二手房的影响因素》一文中,在不考虑宏观经济因素的条件下,单独分析二手房的特征。将影响因素分成了房屋自身,周边环境以及中介三个方面。利用判断矩阵对于所有得到的数据进行排序,认为方便的地段会便于年轻人日常工作和休闲出行。
朱寿佳、甄封。秦萧、何伊伊[3](2015在)《基于核密度估计的南京二手房活跃度特征及影响机制研究》一文中提及到,未来研究居住空间热点主要集中在居住空间社会视角,住宅郊区与土地资源及居民住宅区位选择的微观机制方面,其中,居民选择新房、二手房、租房的住房类型行为则较为复杂。因而,单从一种住房类型(如二手房)下手,能较为深入研究住房选择行为。选取数据时,通过网络数据研究二手房更能反映住房市场状况。
2.变量的选择
我们在链家网上随机选取了40组二手房的数据,而收集到的关于价格影响因素的变量大致分为以下几种。
2.1第一类为房屋的地段
根据前文提到的参考文献,人们选择房屋的时候首要考虑的因素是房屋地段,一个优良的地段往往能给房屋带来很高的增值。而我们重点关注的与地段相关的因素主要分为以下几个方面:(1)第一是房屋所处地到达市中心的距离。这里使用南京东路作为市中心,因为这个地段被认为是上海地区最为繁荣的地段。房屋距离市中心越近人们出行会方便许多,出行时间也会相应的缩短。(2)第二是房屋所处环线,在上海地区,环线将城市分为了几个部分。内环以内属于市中心城区,中环以内属于城市快速通道,外环的是属于免费通行的高速公路。同样是可以确认的是环线越内出行越方便,出行花费的时间越少。(3)作为一线大都市,上海市最为重要的交通工具非地铁莫属。有句话说到好,‘上海地区地铁停运一个白天,整个上海完全陷入瘫痪状态。’在这样的大环境下产生地铁房这一特殊的房屋类型,同样区段的房屋,与地铁站距离越近的,出行会方便很多。
2.2房屋的自身因素 第一个大类中的因素主要是人们根据自身的出行需要对房屋的要求,这些因素是房屋所处地段所带来的外界因素,并不属于房屋本身的因素。而除此之外最重要的因素则是房屋本身所具备的属性,即房屋的建筑性因素。我们搜集到的数据主要将房屋的建筑性因素分为以下几类:(1)第一类因素是房屋的面积,衡量一间房屋自身的因素最为重要的便是房屋的面积。根据边际效用递减理论,当人们对于房屋面积的需求没那么紧迫时,更大的面积带来的效用偏低,因此当人们不需要那么大的面积时,往往会更偏向于选择较小的房屋。(2)第二类因素是房屋的户型,房屋的户型主要是以房屋的客厅数目与卧室数目进行衡量,该因素与房屋的面积有很大程度上的挂钩。因此我们在整理数据时,都使用的是卧室的数目来衡量户型这一变量。(3)第三类因素是房屋所在楼层的高度,这一属性对房屋价格的影响毋庸置疑,房屋所处的楼层偏高,对于人们的日常出行会造成诸多的不便,且这种情况在没有电梯的楼层将会更加的显著。而除了日常出行之外,在人們遭遇意外事故或者灾难比如火灾或者地震时,较低楼层的住户肯定比较高楼层的住户更容易逃生,遭受的经济损失通常也更少。因此我们几乎可以预见较低楼层的房屋价格会高于较高楼层的房屋价格。(4)第四类因素是房屋的朝向,在我们可以搜集到的数据中,房屋朝向一共分为东西南北和南北通五个大类,其中南北通类房屋因为其采光良好,通风流畅,在同等条件下会优于前四种类型。(5)第五类因素是房屋的年限,一栋楼层它的使用年限越久,楼层中出现各种问题的可能性就会增加,同样的我们还需要更多的花费进行维护。因此在同等条件下,人们会更傾向于选择一栋年限较短的房屋。(6)鉴于我们搜集的数据全部来源于二手房,因此数据中会存在一些新房不具备的属性,第六类因素是二手房的装修程度。众所周知,一栋房屋必须是要经过装修才能入住,势必是装修程度越好,房屋价格越高。
2.3第三类为房屋的附加属性
第二个大类中的属性是所有房产几乎都通用的特性。而第三大类中包含了房子一些附加的属性。(1)房屋使用年限。当我们选择二手房时,满二和满五经常出现在房屋的特性中,满五即房屋使用满五年,满二同理。满五的房屋可以减免营业税(后改为增值税)和个人所得税,而满二则只减免营业税,个人所得税依旧需要上交。(2)有无电梯,根据前文提到的房屋楼层对于住户的影响,对于楼层较低的住户而言有无电梯影响较小,但是对于楼层较高的用户电梯会显得十分重要。(3)有无钥匙,该条件主要是涉及到房屋的安全防盗问题。(4)是否有阳台,阳台一般会使房屋采光较好,且有许多其他方便的功能。
3.数据的整理以及模型的建立。
根据上文的描述,我们对变量进行了整理,如表1
对于定量变量我们都直接采用了链家网上面给定的数据,而对于定性变量,我们将其根据不同的水平进行评级打分进而将其量化。比如房屋装修水平我们分为01234五个水平进行评级,而房屋户型我们则直接以卧室的数量进行衡量。而房屋朝向我们则以南北通为3分,朝南为2分,朝其他方位为1分进行评判。我们选取的数据中一共存在有十四组变量,因此最终的模型中会存在明显的多重共线性,我们在采取了逐步回归的方法之后一共剩余了房屋楼层,房屋所在环线,房屋与市中心距离,装修程度,楼层年限5个变量。5个变量的描述统计结果如表2。
我们利用eviews软件对数据进行回归分析(设定显著性水平为10%),在此选择了简单线性回归模型,半对数回归模型和双对数回归模型三种,比较判断后选择了拟合优度较高的半对数回归模型。接着我们对得到的模型进行怀特检验,怀特R2统计量P值等于0.4191,远大于显著性水平的0.1,因此模型不存在异方差。最后对模型进行DW检验,结果DW统计量为1.754006,查阅DW统计量临界值表,k=5,N=40时,dL=0.997,dU=1.652。1.754006>1.652,因此模型不存在误差序列相关性。最终模型的回归结果如下:
经过了数据分析之后我们发现方程的决定系数R2等于0.772,调整系数为0.738,模型拟合度较为良好。所有变量的p值均小于显著性水平的10%,各个变量的t检验通过,F统计量p值远小于10%,说明模型的设立和变量的选择均具有较高的准确性。最终结果进入模型的变量有:楼层区间,房屋到市中心距离,房屋所处环线,装修程度和楼层年限。得出的回归方程为:Y=110837.1-2812.009Z3-601.7194X1-9477.875X3+1627.385Z6-5437.188lnZ5
4.对模型以及变量的解释
4.1 房屋地段
在回归模型中我们可以发现,我们得到的结果中房屋到市中心的距离以及房屋所处的环线这两个因素的相关性较高。但是房屋到地铁站的距离这一因素却相关性很低。造成这一现象的原因可能是,我们使用的数据房屋到达地铁站的距离,但是同等条件下距离地铁站距离相近的同等类型房屋之间区别度很小,而地铁房与非地铁房之间区别度又很大,因此最终我们进行线性回归时到地铁站距离这一项的相关性十分低,最终从模型中剔除。我们从模型中可以看出,房屋到市中心的距离每增加一公里,房屋的价格会减少约601元每平方米。而环线这一因素我们搜集到的数据一共有四种类型,分别是内环内,内中环,中外环,外环外。我们将四个类型分成四个级别按照1234进行打分评级,回归结果显示,房屋地段每往外延伸一个环线级别,房屋的价格会减少9477每平方米。从上述结果我们可以看出,房屋地段对于房屋价格具有非常显著的影响,与参考文献中提到的区位因素作为影响房价最为重要的因素相符合。造成该现象的原因笔者认为主要有以下几点:一、首先上海作为国际大都市,整个上海的面积是十分巨大的,因此通畅的交通对于人们而言非常的重要,当然出行的花费也同样的因为发达的交通而水涨船高。举一个最简单的例子,在这样的条件下,越靠近市中心的房屋日常交通开销会越少,自然会因此对房价产生很大的影响。二、即便上海市的交通系统已经到达了非常发达的地步了,但是由于其本身土地面积较大的缘故,导致地域间跨度十分大。例如地铁9号线,该站的起点站到终点站之间需要花费两个小时左右的车程,如果存在换乘可能还会花费更长的时间。而地铁已经是作为最方便的交通出行工具了,如果换成其他的交通工具那么还将会花费更多的时间。即越远离市中心的地区,出行所花费的时间会越长。三、同样也是因为交通的缘故,尽管地铁系统已经非常的发达,可以做到覆盖很大一部分市区,但是还有更大一部分地区处在地铁无法覆盖的地区,这些地方除了私家车之外最主要的交通工具就是公交车。这些地区的交通会因为没有地铁显得十分的拥堵,私家车出行也经常会受阻,而公交车也因为出行人数过大,在早晚高峰期会非常的拥挤,便利性远远比不上地铁。总而言之,在越远离市中心的地区,出行的难度也会随之直线上升。因此最终我们得出的结论是,同样的房屋条件下,房屋距离市中心越近,房屋越靠近内环,势必房屋的价格会上升的越厉害。而对于地铁房这一特殊类型,地铁房自然会比非地铁房价格高出一大截,但是同等区位条件下的,即同为地铁房或同为非地铁房时,与地铁站的距离并不能对房屋的价格造成多大的影响。 4.2 房屋的基本属性
我们在搜集数据时,寻找了户型,面积,楼层年限,装修程度,楼层高度以及房屋朝向6组变量,而最终得出的方程中,楼层高度,楼层年限以及装修程度的相关性较高。我们现在对这六组变量进行分析。首先是通过检验的变量(1)关于楼层年限,房屋的基础属性当中,楼层年限是影响程度最高的变量。我们最终的模型中得出的数据是,楼层年限每增加百分之一,房屋价格下降约5437元每平方米。采用对数模型的原因是由于相近年限下的房屋价格差异过小。大数据表明,房屋年限在大于二十年之后会存在明显的贬值,而我们搜寻的数据中价格较高的房屋楼层年限几乎都是在二十年以下的。房屋年限增加,楼层基础设施势必会存在老化的问题,维护费用将是一笔不小的数目,但是还远不及此,有的基础设施容易维护,比如墙壁电灯水管,但是有的基础设施维护难度较大,比如电路。维护难度较大的设施使用年限过长的话肯定会导致安全性下降,所以多数人都更加中意年限较短的。另一方面,城市规划往往是偏离较老的城区的,即楼层年限较长的房屋多数会更远离新建设开发的地区,导致地段偏差。在这里不采用简单线性回归的重要原因是满二与满五这一特殊因素的存在,该因素虽然最终没有进入回归方程,但是肯定会影响房屋价格,并该影响的趋势是年限越长价格越高,与楼层年限的影响趋势恰好相反。因此最终选择半对数模型。(2)房屋楼层这一因素由于不同的楼层高度不同,因此如果直接采用具体楼层数目作为原始数据进行回归显然不合理。所以我们并没有直接将楼层的高度作为原始数据,而是最后将楼层数据按低区中区高区三个区段按照一级二级三级进行评级。回归结果显示,楼层每上升一个区段,房屋价格下降约2812元每平方米。这一结果显然在情理之中,无论是日常起居,购置家电,以至于搬家等活动,楼层越高,上述行为操作起来的难度就会越大,这种现象特别是存在于没有电梯的楼房,操作难度更是直线攀升。同样的还有之前提到的意外事故发生时,较低的楼层往往更容易脱离危险,且遭受的经济损失往往也比较高楼层的住户更少。(3)结果显示装修程度越高,房屋价格越低,我们使用01234五个等级对于房屋装修程度进行评级,结果数据表明,评级每上升一个等级,房屋价格上升约1627元每平方米,原因可想而知,装修是房屋入住的基本条件,而装修程度越高,入住后相应的装修花费就会越少,甚至于不用装修即可入住。所以房屋的价格也随着装修程度的提高而提高。。再来是我们剔除的变量进行分析(1)房屋面积作为房屋最为重要的属性,在前文的分析中,看似理应成为重要的解释变量之一,但是我们选取的数据在上海地区,存在一个很重要的影响因素。在上海地区的房价毋庸置疑是全国最高的,且多数地段的价格也已经远远高出了很多非上海本地人可以接受的程度,最为直观的数据就是,在我们搜集的40组数据当中,最便宜一套房产的价格也达到了36674元每平方米,较之于一般的中小型城市每平米几千元的价格也是远远超出。因此房价过高必然会导致房贷压力重,最直接的影响就是人们购房是多数会选择较小的户型,我们搜集到的数据中最后得到的平均面积也只有不到80平米。同样的,在综述中提到的上海市土地建设用地红线,仅剩的61平方公里几乎无法利用,土地资源已经到达了极为紧张的地步,因此多数房屋都是属于小户型房屋。我们在链家网上可以寻找到挂牌的近9万套二手房产里面,小于90平米的房屋占据了一半以上。同樣的我们选取的40组数据也是多数在小于90平米。而小于90平米的房屋对于一般的三口之家而言只能算是够用而不是充裕,则不会存在前文数据搜集中笔者提到的由于房屋面积偏大而产生的边际效益递减现象。因此我们最终得到的结果里面不同数据之间区分度较小,导致最终的模型中房屋面积这一项的相关性较低,因此将该变量剔除。(2)我们研究户型时采用的是用房间数目对于这一变量进行衡量。毫无疑问户型该变量与房屋面积具有很高的相关性,而最终结果这一变量和房屋面积一样相关性较低。因为同样的原因,我们搜集到的平均面積在80平米左右的房屋,多数的数据都是两室一厅,因此最终该变量也同样的因为不同数据之间区分度过低剔除。(3房屋朝向这一因素最终没有进入我们的回归模型当中,同样是因为不同数据之间区分度过小的原因,链家网上近9万所房产,朝南和南北通的房屋分别是3.4万与3.8万,同样也反应在我们的数据当中,我们选择的数据也几乎没有朝东西北的房屋,因此最终剔除该变量。
4.3 房屋的附加属性
在我们最终得到的模型中,该大类并没有数据进入回归方程内。主要原因是,在我们找到的40组数据当中,几乎都是满五的房屋。因此在我们的样本之中很难界定出满五满二对于房屋价格的影响。同样的现象还发生在另外几个附加属性上,多数房产都有钥匙,多数房产都有阳台。而关于有无电梯该变量,该变量对最终结果有一定程度上的影响,但是最终由于T检验不合格剔除。造成该现象的原因笔者认为主要是不同高度楼层的住户对于电梯的需求度有很大的不同。诚然对于高层住户而言电梯是生活必备条件,但是对于多数低区住户而言,电梯的有无对于生活的影响微乎其微。因此最终该变量尽管对被解释变量有一定程度的影响,但是由于内部条件存在一定的矛盾使得结果误差偏离较大,导致最终的T检验未通过,因此从模型中剔除。
5.结语
本文基于特征分析方法以及多元线性回归模型分析了影响上海地区房屋价格的因素,总结为以下几点:
首先是房屋的地段,从模型中我们可以看出,房屋地段类因素对价格影响最大。而其中影响程度最高的是房屋所在环线。即现代人对房屋的需求开始转变,即日常生活以及休闲出行。
其次是房屋自身的基本属性,楼层高度和楼层年限占主要影响因素,在除了房屋的区位因素之外,可以看出人们选择房屋更偏向于房屋的安全性和便利性。除此之外因为是二手房,所有装修程度不可避免的成为了重要影响因素之一。而关于房屋朝向等影响人们日常生活舒适性的因素在如今快节奏的生活背景下开始显得没有那么重要。
关于房屋的一系列附加因素,这些因素或许会对房屋价格有一定的影响,因为这些附加因素多数房屋都涵盖了,并不能成为优势因素存在。以及电梯这一因素,由于自身存在一定的矛盾性因此也没有成为决定性因素。
参考文献:
[1]高文林.二手房价格评估的影响因素及方法选择[J]中国房地产2012.08
[2]丁战、孙国庆.剖析选购二手房的影响因素[J]经济论坛2007.02
[3]朱寿佳、甄封。秦萧、何伊伊.基于核密度估计的南京二手房活跃度特征及影响机制研究[J]地球信息科学报2015.06
[4]缪格、李英冰、袁菲.基于多元回归法的武汉市二手房价格影响因素的研究[J]城市勘测2017.01