论文部分内容阅读
近些年,房地产行业的快速发展,得益于我国政府不断地推出相关的利好政策。但在其持续发展的同时,也让越来越多的投资者在该行业不断加注,导致增加了房地产泡沫。在2019年召开的十九大会议中,习近平总书记出“房住不炒”的要求,同时也明确指出:“健全地方税体系,稳步推进房地产税立法”。在国家和地方颁布的各项房地产市场调控政策以及推进相关房地产税立法的大背景下,房地产市场仍存在大量的交易活动,这些交易活动的公平性、透明性、客观性是影响房地产行业健康、持续长久发展的重要因素,这些特性的体现都要取决于交易时是否存在一个客观公正的交易价,而资产评估恰好可以保证交易价的公正客观。在传统资产估价方法中,往往是由估价师运用市场法、收益法等方法来对房产进行单宗评估,但这种估价方式得到的估价结果主观性较强且估价效率低,估价的准确性很难界定。在房产数量越来越多的情况下,采用该种方法无法满足估价的需求,同时该种方法的估价成本也较大。因此,本文从现代估价视角以及估价需求出发,结合信息技术,探讨研究采用何种估价方法可以更加符合时代特征、更高准确度、更高效率地分析住宅价格。本文通过研究国内外相关文献,梳理房产估价基础理论,采用定量与定性研究法等方法,对房地产估价方法进行探讨研究。首先,本文阐述了单宗评估与批量估价的异同点,并指出传统的单宗评估无法满足现在的估价需求,因此出了采用批量估价方法进行研究。并针对批量估价,分析其应用前以及估价原则与流程。本文分析了在大数据时代下房产估价的特点以及大数据时代下对房产进行批量估价的优势所在,同时针对房产估价的特点,分析运用何种大数据技术对房产进行估价可以达到高效率与准确率的目标,最终选用网络爬虫、Python技术、以及百度地图API等大数据技术来进行估价分析。其次,本文概述了北京海淀区住宅二手房的市场情况,确定了本文的估价对象是北京市海淀区的二手普通住宅,价值时点是2020年11月1日。本文采用多因素分析法筛选批量估价模型的特征变量,最终确定了4大方面特征,共计19个特征变量。并利用大数据技术:网络爬虫和百度地图API来获取每个估价对象的19个特征变量所对应的数据,获取数据的时间范围是2020年9-10月。并对获取到的数据进行量化、离群与缺失值处理以及数据归一化处理,使得数据更加规范化、标准化。最后,本文通过分析常见估价模型的优缺点,结合本文估价对象的特性,选用了“随机森林+BP神经网络”批量估价模型。运用大数据技术:Python来实现该批量估价模型的构建,并带入北京海淀区二手普通住宅的真实数据进行验证。并针对高精度要求下的住宅估价出了新的估价方法,即采用批量估价模型与基准价修正体系相结合的方法,且带入了真实案例进行验证,结果表明该方法确实可以进一步地高估价结果的预测精度,使得预测价格更加接近实际的成交价格。基于理论研究与实际案例的验证结果,本文认为:(1)批量估价模型的估价结果较为准确,且可以同时评估出大量的房产价值,估价效率较高。同时减少了人工的工作量,也相应的降低了估价成本和估价主观性对结果的影响,满足了现代估价的各项需求;(2)由估价结果可以看到:随机森林单模型预测准确度为84.4%,BP神经网络单模型预测准确度为82.5%,基于模型集成的思想,批量估价模型的预测准确度为90%。由此可见,批量估价模型的估价精度大于任一个单模型的精度,且符合估价时至少采用两种方法的估价要求;(3)通过文献研究法以及考虑到实际交易过程中会影响房价的因素,本文将住宅价格特征变量体系分为区位、建筑、邻里以及社会四大特征,共19个特征变量。在传统特征变量体系中加入了社会因素,用交易日期与挂牌时间进行表达量化,同时将真实成交价格作为因变量,避免了交易双方的心理因素对结果的影响。进一步完善了该体系,使得估价结果更加贴近市场真实成交价格。本文应用大数据技术分析构建了基于机器学习的住宅批量估价模型,为房地产批量估价方法的研究供了理论和方法参考。