论文部分内容阅读
人们的生活方式和消费习惯因为互联网的普及而发生着潜移默化的影响,互联网中包含着海量网络数据,人们在作各种决策时习惯于通过搜索引擎在互联网上找寻相关信息,尤其是消费决策。消费者以搜索引擎为桥梁,以搜索关键词为钥匙在互联网中找寻信息,所以搜索关键词在一定程度上代表着消费者的关注热点,搜索量则可以代表着关注程度。由此可以总结到网络搜索关键词数据映射着市场主体的关注点,揭示市场主体行为趋势,可以为宏观经济问题提供所需要的微观数据。由于住宅销售产业是国民经济社会快速发展的关键推动力,各界研究学者越来越关注住宅价格,特别是大中城市的住宅价格更是重中之重,本文以西安为例对新建商品住宅销售价格指数与网络搜索关键词数据进行研究。文章以均衡价格为理论基础,首先从宏微观角度分析住宅价格主要影响因素是供需关系,并以此进行理论分析,从定性的角度阐述新建商品住宅销售价格与网络搜索关键词数据之间的关系。从住宅价格影响因素的角度出发,使用核心关键词和拓展关键词选取方法,对网络搜索关键词进行初选,形成包含63个搜索关键词的初选词库;然后使用核心关键词运用灰色关联度方法,从定量的角度分析了西安新建商品住宅销售价格指数与网络搜索关键词数据之间的关系。然后,使用Spearman相关性分析筛选出高相关性的搜索关键词和使用时差相关分析法选出先行搜索关键词,并使用主成分分析方法进行关键词指标的综合,形成四个综合指标。最后,以综合指标为模型输入建立神经网络、支持向量机以及随机森林预测模型,对这三个模型进行预测性能分析比较,随机森林预测模型精度较高,在此基础上对三个模型预测结果进行融合,使用梯度迭代决策树模型对三个模型的预测结果再次进行挖掘分析,得出最优的住宅价格指数预测模型。得出的结论主要有以下三点:(1)网络搜索关键词与西安新建商品住宅价格有较强的相关性;(2)梯度迭代决策树模型融合的预测结果优于单个模型的预测结果,拟合度为0.995;(3)使用网络搜索关键词数据可以比国家统计局提前半个月统计出住宅价格指数。