论文部分内容阅读
中国的房地产行业在经济中扮演着重要的角色,一直是经济增长的强劲驱动力。房地产投资占国内生产总值的比重也飞速增长,从1997年的4%到2014年的15%。尤其是住宅投资方面,与其他国家相比一直居高不下。如今,房地产投资占固定资产投资的15%,城市总就业机会的15%,银行贷款份额占贷款总额的20%。房地产行业在连接上下游销售和产业链方面具有很强的能力,也是地方财政的主要来源。随着“互联网+”时代的到来,大数据在大众生活的方方面面有着越来越多的应用。体现在对房地产市场的价格走势方面,可利用房地产网络交易网站的开源数据来编制房地产价格指数,以更及时、准确地对房地产市场的总体趋向和发展进行把握。本论文在编制房地产价格指数的过程当中,充分利用网络爬虫、HTML、正则表达式等技术,提取房地产网络交易网站数据,同时在Hedonic模型的基础上,对济南市二手住房价格指数进行编制,具体表现为如下几个方面:(1)在Hedonic模型的基础上编制房地产价格指数摒弃了传统的房地产价格指数编制的数据获得来源,基于获取到的房地产交易开源数据来选择Hedonic模型的具体形式,并选取和调整函数中的变量,确定最终的模型形式,以济南市二手房产市场为例估算和修正Hedonic模型。(2)搜集、提取并数字化房地产交易开源数据分析网页源代码,利用Web爬虫和HTML等网络信息收集和提取技术,取得了与传统方法相比更稳定、即时的房产交易属性数据,并对获取的房产开源数据进行清洗和量化。(3)以济南市二手房产市场为例编制价格指数利用网络爬虫技术获取的房产交易网络数据,在Hedonic模型的基础上,编制了济南市二手房产价格指数。将计算得到的指数与国家统计局发布的官方指数相比较,得到结果与“七十个大中城市二手住宅分类价格指数”非常接近。