网络搜索数据在预测房地产价格指数中的应用研究

被引量 : 0次 | 上传用户:kaka43210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网的快速发展以及信息技术的普及,人们的生活已经越来越离不开网络。人们可以利用搜索引擎查询新闻和感兴趣的信息,也可以利用即时通讯软件如腾讯QQ、微信等进行聊天。互联网已经成为了巨大的数据库。网络搜索数据蕴含了三亿多市场主体的兴趣与关注,反映其行为趋势与规律,为研究宏观经济问题提供了必要的微观数据基础。房地产行业是国民经济的支柱性产业,研究中国房价对百姓的生活和社会经济的发展都具有现实意义。北京市作为中国经济、政治和文化中心,也是目前人口聚集度非常高的城市。北京的房价不仅越来越影响到居民的正常生活,而且还关乎着社会的稳定。因此国家统计局发布了70大中城市住宅价格指数,使人们了解房价的变动趋势,同时也为研究人员提供数据依据。本文运用北京新建住宅价格指数和网络搜索数据进行研究。本文从影响房价的微观因素与宏观因素考虑房地产市场的供给与需求,以均衡价格理论和传导时滞为理论依据,建立一个概念框架。在研究过程中运用文本挖掘的方法对网络上的房价新闻信息进行分词处理,得到权重较高的关键词;运用了一些拓展关键词的方法对初步得到的关键词进行拓展,如长尾关键词、需求图谱等;然后,利用皮尔森相关系数和时差相关分析法基于网络搜索数据与北京新建住宅价格指数间的相关系数和领先阶数对关键词进行筛选。本文选取了相关系数绝对值在0.5以上的关键词,继而分别运用K-均值聚类法和主成分分析法对关键词进行处理,得到衡量北京新建住宅价格指数的指标。在实证分析中运用K-均值聚类法对关键词进行分类,得到每个类别里最能代表类别信息的关键词作为解释变量,又运用主成分分析法将关键词进行合并得到两大类指标,分别是微观搜索指标和宏观搜索指标。最后,运用分别得到的解释变量建立北京新建住宅价格指数与网络搜索数据间的回归模型,将两个回归模型的拟合优度和预测精度进行对比。得出结论:(1)对于微观因素的关键词,人们大多会提前一年的时间进行信息的搜索,如二手房信息以及住房的物业管理信息;对于宏观因素的关键词,对房价感兴趣的购房者通常会提前半年到一年的时间关注价格、工资水平、住房附近的教育水平等信息。(2)北京新建住宅价格指数的一阶滞后项对本身有着显著的解释能力。(3)K-均值聚类分析所建立的模型拟合优度为0.86,运用该模型对2015年08月-12月的北京房价指数进行预测,得到预测值与实际值的平均绝对误差为0.234。与用主成分分析方法所建立的拟合优度为0.82,平均绝对误差值为0.309的模型相比,发现运用聚类分析对关键词进行筛选和优化后能够得到拟合优度更高的模型和误差更小的预测结果。
其他文献
指出随着高等教育的快速发展,学习动力理论及其应用受到了教育者的普遍关注。系统地研究了学习动力的基础概念、学习动力的理论基础和教学动力理论。该研究有利于学习动力理
近年来,部分商业银行已经构建了24小时的自助服务模式,先行完成了从网点处理向自助交易的主渠道转型,自助服务的替代效应日趋显著。同期,这种24小时的ATM运营服务模式可能面
现代心理学研究表明:学生的学习过程并不是一个"纯认识"的过程,它包括认知过程和情感过程。前苏联教育家马卡连柯说过:"教育儿童最好的方法是鼓励他们的好行为。"因此将情感
主持人:中国医科大学第一附属医院张乾忠教授应邀专家:山东省立医院马沛然教授南京军区福州总医院陈新民教授华西医科大学第二附属医院唐胜才教授北京医科大学第一医院杜军保教
法国核电计划的实施成就法国的核电计划实施至今已有20多年的历史。法国政府是在第一次石油冲击后决定实施这一核电计划的。迄今为止,法国已有54座核电机组投入使用。法国核电计划
目的:合理的膳食可有效的控制血脂。方法:对高血脂症患者进行疾病知识的宣教,饮食指导。结果:通过有效的膳食指导可使患者了解高血脂症成因,掌握合理膳食方法。
P2P能提供基于节点的独立、动态的连接方式,将彻底颠覆以往企业中计算资源的分配规则,不仅让网络更具灵活性,还很好地解决了集中式计算模式最为头痛的网络拥塞问题。P2P企业
分析了定制的历史变迁及其需求与供给因素,指出定制是市场多元化发展的必然,需要加强对定制过程的管理,探讨了打造差异化竞争力"护城河"可供选择的定制策略措施,以及商业银行
从方差的意义上对串级控制系统的控制性能进行了评价.根据反馈不变项理论,得到串级控制系统在最小方差控制器作用下的输出表达式,该表达式可通过采用时间序列模型进行拟合,从
目的:了解医学院学生艾滋病相关知识、态度、行为现状及其影响因素,为进一步有效开展学校艾滋病健康教育提供科学依据。方法:自行设计问卷,分层随机抽取某医学院606名大学生