论文部分内容阅读
网络搜索数据蕴含了数以亿计的市场参与主体的兴趣与关注,通常代表市场参与主体的预期、预示着其下一步的经济行为。因此我们可以利用广大消费者通过互联网的搜索痕迹与房地产相关的搜索词汇对商品房的价格进行短期预测。基于此,我们以百度搜索指数为样本数据,对数据缺省值进行处理以及删除方差为零的变量,从待选的60个搜索关键词中选出23个数据变量作为自变量。实证研究部分对数据使用了6种回归模型来对武汉市洪山区的商品房价格进行了拟合和预测,得到了预测洪山区商品房价格变动的最优模型。结果显示:线性回归模型和随机森林的预测值效果最优,平均误差率仅有-0.11%和0.13%。文章所用方法可预测商品房房价领先于官方发布数据10-15天。文章最后根据实证结果提出相关建议。