【摘 要】
:
随着我国经济的快速发展和人们生活水平的不断提高,人们对出行的需求也日益多元化,在出行过程中更注重住宿体验感,相比价格高且单一化的酒店,可住出“家的感觉”的共享住宿更受到人们的青睐,共享住宿的市场规模也因此不断扩张。共享住宿房源价格会影响到人们的消费选择,进而影响到房东和平台的收益,因此建立科学准确的价格预测模型,提供合理的定价建议,对于共享住宿平台、房东、消费者皆有参考意义。基于上述原因,本文选取
论文部分内容阅读
随着我国经济的快速发展和人们生活水平的不断提高,人们对出行的需求也日益多元化,在出行过程中更注重住宿体验感,相比价格高且单一化的酒店,可住出“家的感觉”的共享住宿更受到人们的青睐,共享住宿的市场规模也因此不断扩张。共享住宿房源价格会影响到人们的消费选择,进而影响到房东和平台的收益,因此建立科学准确的价格预测模型,提供合理的定价建议,对于共享住宿平台、房东、消费者皆有参考意义。基于上述原因,本文选取共享住宿平台Airbnb上海市房源为研究对象。首先通过文献梳理初步选出影响共享住宿房源价格的29个因素,为提升数据质量,对数据集进行一系列的预处理,包括缺失值处理、特征编码、特征构建和筛选,由于考虑到房源周围环境的影响,本文通过特征构建增加地铁站距离、车站距离、景区距离、周围竞争程度4个特征。然后选取Bagging代表算法随机森林,Boosting代表算法XGBoost和LightGBM,分别构建共享住宿房源价格预测模型,并通过Stacking方法对以上三种模型进行融合,使用MSE、MAE和R~2三个指标评估各个模型的预测效果。最后使用SHAP方法对价格预测模型中各个特征的影响程度进行分析,并给出影响共享住宿房源价格的关键因素。通过本文的研究发现:(1)在随机森林、XGBoost、LightGBM三种房源价格预测模型中,XGBoost模型表现最好;通过Stacking方法对模型进行融合后,有效地提高了模型预测的效果,相较于单一模型,预测误差更小、精度更高,在MSE、MAE和R~2三个指标中分别达到0.065、0.177、80.6%。综合对比,Stacking融合模型在共享住宿房源价格预测中效果最好。(2)通过SHAP分析得出影响共享住宿房源价格的关键因素为房源类型、设施、出租规则及地理位置四大类,具体可包含卧室数、可容纳人数、房源设施数、房源出租类型、房源类型、预定天数、周围竞争程度、房源位置等。本文的研究不仅可以帮助房东在房源上线前预估价格、合理定位,在房源上线后优化服务、提高收益,还可以帮助平台进一步完善价格推荐功能,为消费者推荐更合适的房源,使消费者获得更好的住宿体验。
其他文献
时间序列预测是当前研究热点问题。深度学习具有从数据集中识别有效信息和检测模式的显著能力,使得其目前越来越广泛应用于时间序列预测尤其是金融时间序列预测领域。本文将正则化注意力机制引入LSTM-CNN混合模型中,提出了一种基于正则化注意力机制的LSTM-CNN预测模型。LSTM神经网络的独特门结构随时间动态掌握数据结构,CNN神经网络中的卷积层和池化层可以从时间序列数据中捕捉局部模式和复杂特征,可以充
现有研究表明行业间收入不公对于我国城镇居民收入差距产生的影响愈来愈大。造成行业间收入差距扩大的原因是多样的,但主要还是人力资本分配的问题。人力资本分配不均会加大行业间收入差距从而导致行业垄断,同时垄断行业又反过来影响人力资本分配加剧人力资本分配不均的状况,这一恶性循环使得最近我国各行业间的收入差距越来越大。本文主要以我国各行业收入差距以及各行业人力资本的分配情况为切入点,研究各行业人力资本错配的程
随着中国社会经济持续繁荣发展,一些具有较强资本能力的企业与个人不断参与金融资本活动,金融市场上交易量随之逐年递增,伴随其中的金融市场波动情况自然成为人们较为关注的热点领域。而基于波动率模型分析金融资产的波动性,可以为市场上的投资者们在投资时提供参考,在一定程度上降低投资的风险。因此,研究的核心问题就集中到如何选择合适的模型来拟合金融市场的波动率,对风险进行有效的预测。为了分析股市高频数据的波动变化
产业集聚是指同一产业中的一定数量的企业聚集在固定区域以获取集聚效益的机制,高技术产业集聚具有更加完善的经济效应,可以推动经济高质量发展。长三角高技术产业已形成电子信息行业、计算机设备行业以及医药制造行业的产业集群,本文从长三角高技术产业集聚出发,按照总体经济增长效率、经济发展整体稳定性、产业结构优化、社会福利质量与经济社会绿色循环发展这五个维度构建了经济增长质量综合指标。利用2000-2020年长
经济增长动能不足已成为制约中国迈向高质量发展阶段的一大阻力,深化金融体系变革有望成为释放中国经济发展活力的经济增长点。数字普惠金融是金融体系变革的主要产物,其弥补了传统金融体系无法充分赋能实体经济、金融资源配置不均衡不充分、“嫌贫爱富”的缺陷,在与数字技术的深度融合中,普惠金融服务能够覆盖到每一个市场主体,普惠金融的价值能够延伸至整个国民经济体系。在实现第二个百年奋斗目标的开局之年,让数字普惠金融
酵母管理的主要目标是提高或保持酵母菌的完整性和活力,新鲜健康的酵母菌才能够表现出其优良的发酵特性,产生独特的风味,来满足啤酒厂的生产。本文将讨论啤酒厂的酵母管理,以应用于酵母储存、酵母回收、酵母混合物中的酒液回收和设备选择。
21世纪以后,随着人口红利的消失,安徽省传统的资源消耗型、低成本劳动力密集型等产业逐渐跟不上新时代的发展,急需向高科技密集型,高附加值等产业转变。近20年以来,安徽省产业结构优化升级颇具成效。受国内外发展环境变化的影响,安徽省要想继续保持经济健康稳定的发展,必须对产业结构升级提出更高的要求。基于此,本文试图从产业关联和空间布局两个角度探究安徽省产业结构升级的特征和发展规律,以期为安徽省产业升级和经
从定量的角度出发来预测我国宏观经济,尽管现已取得丰硕的研究成果,但绝大多数研究成果都是以点值型数据为基础进行分析的,而点值数据含有的信息量也是很有限的。如今,区间数据在经济,金融和社会生活中分布广泛,它刻画了变量的变化范围,包含了更多的信息量。因此,面对此种背景,本文旨在区间数据环境下,通过半参数回归的视角去分析预测宏观经济的状况。针对文章所研究的主要问题,本文主要做了以下几个方面的工作:一是从区
2020年我国顺利完成了脱贫攻坚的各项目标,实现了现行贫困标准下农村绝对贫困人口的全面脱贫。绝对贫困的消除并不是反贫困工作的终点,而是向高质量、高标准的起点。后2020时期,我国反贫困工作的重点是治理相对贫困问题,与绝对贫困相比,相对贫困具有隐蔽、复杂的特点,且城乡间、区域间、乡村内部及城镇内部呈现不同的特征。本文通过对我国的相对贫困现状进行分析,探究相对贫困标准的设置及其影响因素,对于制定相关的
<正>地中海饮食连续被美国一项排行评估机构评价为位列整体最佳饮食的榜首,而地中海饮食的最大特点就是使用橄榄油。国际橄榄油协会(IOC)将橄榄油分为初榨橄榄油、精炼橄榄油和油橄榄果渣油几类,品质依次递减。初榨橄榄油使用新鲜橄榄,通过物理手段(没有高温加热和化学方法)直接制得,最大程度保留了营养成分。精炼橄榄油是初榨橄榄油经脱色,脱臭等化学工艺提取的产物。