【摘 要】
:
随着我国旅游业的迅速发展,旅游大数据分析备受人们关注。旅游大数据通常存在来源广、数据不完整、时间不稳定等问题,使数据分析有很大难度。酒店业是旅游业的一个重要组成部
论文部分内容阅读
随着我国旅游业的迅速发展,旅游大数据分析备受人们关注。旅游大数据通常存在来源广、数据不完整、时间不稳定等问题,使数据分析有很大难度。酒店业是旅游业的一个重要组成部分,酒店入住率是衡量一个酒店运营情况的重要因素之一,运用机器学习方法对酒店入住率进行预测分析具有重要意义。首先,对旅游数据描述和预处理。分析旅游数据并给出数据来源和描述,阐述旅游数据的特点和规律,从时间维度和酒店维度将数据分类,初步选取可用数据。对此数据进行数据清洗、数据变换、数据归一化,并设计数据集融合算法融合数据集,以获得最优数据集。然后,提出基于旅游数据的酒店入住率双层预测分析模型。分别在时间维度、时间-酒店维度建模,第一层模型是基于时间的回归预测模型(以下简称“第一层模型”),是运用多项式回归方法分别对车流量、天气情况、风力、最高气温、最低气温、空气质量进行回归分析,得出其预测值,作为第二层模型的输入。第二层模型是基于时间和空间的酒店入住率双层预测分析模型(以下简称“第二层模型”),将第一层模型的预测值与固有数据集整合,对整合数据分别基于BP神经网络、KNN、随机森林算法建立酒店入住率BP神经网络分类模型、酒店入住率KNN分类模型、酒店入住率随机森林分类模型。最后,搭建实验环境,观察并分析实验结果。经过数据预处理得到最终数据集,实现基于时间的酒店领域回归预测模型,整合结果集,接着实现基于时间和空间的酒店入住率分类预测模型,然后用相应的误差参数对结果进行评价。实验证明提出的模型和方法是有效的。
其他文献
目的 探讨Pringle法及Glisson鞘选择性入肝血流阻断法在肝脏切除手术中的效果及临床意义.方法 收集我院接受肝脏切除手术的患者,疾病诊断为原发肝脏肿瘤,类型为肝血管肉瘤、
火灾下钢结构热响应分析有助于结构抗火设计,增强钢结构在高温下的结构稳定性能。本文介绍了火灾模拟和钢结构热响应模拟的方法及其基本理论;总结了近年来火灾模拟和钢结构热
保加利亚-巴尔干睡美人欧洲双子星之一的保加利亚,位于欧罗巴的东南方,东与黑海相邻。北与罗马尼亚隔河相望,卧居在多瑙河和土耳其之间,境内有雄伟的山峰、起伏的丘陵、奇特的山
学生英语作文中总有难以根除的汉语痕迹。通过对大量学生作文的分析和统计,发现学生英语作文的汉语痕迹不仅存在于词汇和句型方面,也存在于语篇方面。汉语没有词形变化,句式
本文通过介绍太钢尖山铁矿从2013年以来运用安全绩效进行安全管理的做法和体会,阐述了安全绩效在企业安全管理中的重要性,为企业长远的安全管理发展打下了坚实的基础。
目的了解上海市部份地区健康人群水痘-带状疱疹病毒(VZV)自然感染状况。方法采集0~50岁健康人群血清标本921人份,用酶联免疫吸附试验测定抗体水平。结果人群血清中抗VZV-IgG
目的观察浅表性膀胱癌经尿道腔内手术治疗的适应证与疗效。方法随机选取我院2017年2月—2018年2月收治的浅表性膀胱癌患者88例作为研究对象。依照入院顺序,将其分成对照组和
目的:研究不同处理方法对人脱细胞脐动脉的组织结构影响,并比较其生物力学性质,为小口径组织工程人工血管支架的选择提供依据。方法:搏动条件下采用酶消化法脱去人脐动脉中的细
本文则以在石化工程建设企业运行的HSE和安全标准化两种管理体系为切入点,分析其相同点和二者一体化建设可行性,并提出具体整合措施。
目的研究分析腹腔镜下保留生育功能宫颈癌根治术对早期宫颈癌的治疗效果。方法 2012年11月—2013年11月对我院的60例早期宫颈癌患者开展研究分析,全部患者共分为了对照组和观