论文部分内容阅读
随着中国城市化进程的不断推进和住房制度的深入改革,房地产市场蓬勃发展,给国民经济带来丰厚收益的同时,也引发了房产投资过热、房价过高、住房供给不平衡等诸多经济和社会问题,制约着城市产业的发展。因此,房地产市场的发展备受政府、开发商、居民和学术界的关注。城市住宅价格作为监控房地产发展的重要指标,在时间序列和空间分布上具有差异性。研究城市住宅价格的时空差异和演变特征,可判断房地产市场的发展是否均衡,为决策机构提供参考。随着房地产商业网站的兴起,海量房地产信息公开于网络,使得利用大数据技术进行城市房地产的研究,探索城市房地产的时空变化规律成为可能。 针对海量的泛在网络实时房产数据,本文构建了一种长时序时空大数据挖掘方法。首先,基于网络爬虫技术,构建多源网络房地产信息获取平台,持续获取搜房网、安居客、我爱我家等主要房地产商业门户网站公开的房源信息,在自然语言文本时空处理技术的支持下,形成房地产样本时空数据库;其次,利用房地产挂牌数据和成交数据,进行了泛在网络房产数据的可用性验证;接着提出了“混合像元”多尺度栅格模型,以构建基于栅格系统的房产统计特征描述,解决了多源网络房产数据融合方法,基于P-Bshade和邻近栅格时空插值算法完成了稀疏房产数据的插值问题,构建了长时序房地产时空栅格数据库;最后通过栅格区划算法形成房价、房价环比增量和房地产投资区划。通过以上步骤,形成了泛在网络房产时空大数据的分析方法和框架体系。最后,以北京六环范围内二手房为研究实例,运用上述方法进行了相关分析和挖掘。 本文的主要研究内容和成果包含以下四个方面: (1)网络房产数据的可用性验证 以泛在网络二手房挂牌信息为基础数据,采用一元线性回归模型对二手房挂牌价格和成交价格进行相关性验证。结果表明二手房挂牌价格与成交价格的相关性系数R达到0.995,两者具有显著的线性正相关性,由此表明利用泛在网络房产信息进行房地产研究具有可行性。 (2)二手房价格时空演变特征及影响因素分析 利用“混合像元”多尺度栅格模型和栅格区划模型,形成北京市二手房价格的时空格局。结果表明北京市二手房价格存在时空差异性。2016年二手房价格呈波动式增长趋势,前半年涨幅大于后半年。以东西城区为核心形成房价高值区,并向四周以不同幅度递减。在中关村-万柳、亚奥中心、望京等地区出现了价格高地。价格等级较低的区块沿交通环线呈环状分布,价格等级较高的区块成团状聚集。影响二手房价格的空间分布的兴趣点因素有重点中小学、公园绿地、地铁、公司企业等,而医院、银行与二手房价格的空间分异并无明显的相关关系。 (3)二手房价格环比增量时空演变特征 以月为时间截面,分析二手房价格环比增量的时空演变特征。与二手房价格的时空演变特征相比,二手房价格环比增量时空演变特征在时空上都呈现较大的差异。其中2015年12月、2016年4月和8月出现了全城二手房价格爆发式增长。从二手房价格的绝对变化量来看,中心城区的价格增量较小,而中心城区周边的增量较大。从二手房价格的相对变化量来看,城郊住宅价格的上涨幅度高于城中心。由中心城区向城区周边表现增幅变大的趋势。 (4)二手房投资区划模型 基于二手房价格区划模型,形成二手房首付区划模型,并分析了不同首付比率下二手房首付的时空变化,最后针对不同的投资需求给出相应的投资建议。