基于集成学习的精品旅游服务成单预测研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:beginI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于居民收入的持续提高,以服务业为主导的消费行业在中国越来越重要,旅游越来越成为人们日常生活中不可或缺的一部分。随着消费者多样化和非标准化的旅游服务需求的增多,消费者的行为逐渐变得难以预测。对消费者需求进行合理预测,分析挖掘消费者偏好、消费能力和购买行为规律,将对综合性在线旅行社(Online Travel Agency,OTA)向智能出行管家(Intelligence Travel Assistant,ITA)转变起到至关重要的作用。本文以OTA平台四万多名用户的基本信息、行为信息、订单信息和评论信息为数据挖掘对象,以构建预测用户在短期内是否会订购精品旅游服务的集成学习模型为目标。通过数据分析与特征工程,探讨从原始数据集中构造重要特征的方法,通过建模分析与对比分析,构建准确高效的精品旅游服务成单预测模型。本文首先在分析了国内外研究现状的基础上,介绍了LightGBM算法、CatBoost算法、随机森林(Random Forest,RF)算法和极端随机树(Extremely randomized Trees,ET)算法的原理及关键技术;其次,从数据来源、数据结构和统计分析三个方面对原始数据进行了详细的分析,其中统计分析包括:数据量分析、字段缺失分析、用户地区分析、操作类型分析、历史订单类型分析、评分分析和预测目标分析;然后,从数据预处理、特征构造、特征抽取和特征选择四个维度针对原始数据进行特征工程处理,在特征构造阶段提取了47个表征特征、860个行为特征、141个状态特征和21个利益特征,利用集成学习算法的特性计算得到了特征的综合重要度,并基于该特征重要度对特征进行了选择;然后,基于分割后的训练集和测试集,对比分析了以XGBoost、LightGBM、CatBoost、RF和ET算法构建的五个单模型的预测效果和效率,通过引入特征多样性和算法及算法参数多样性,构建并分析学习法和加权法两种组合策略下的混合模型,确定了以加权的方式对XGBoost、LightGBM和CatBoost三个基模型进行融合;最后,对比分析了单模型与混合模型的AUC值和训练预测总耗时。本文的研究结果表明,混合模型无论基于那种组合策略,其预测效果优于各单模型。在组合策略方面,学习法组合策略在预测效果上优于加权法,但其效率较低。就一种单模型而言,CatBoost算法效率虽然略低于其他算法,但其预测效果是最好的。基于加权法的集成学习混合模型,提高了精品旅游服务成单预测效果的同时,保证了预测效率在一个合理的范围内。
其他文献
工业生产导致的大量CO2排放引起了日益严重的环境影响,因此,CO2减排成为国内外急需解决的问题之一。CCUS技术则是一类重要的CO2减排技术,其中CO2捕获技术作为CCUS技术中必不
聚氨基酸型高分子因具有可降解性、非免疫原性与良好的生物相容性,有着广阔的应用前景。在医药领域,设计合成的聚氨基酸纳米载体具有特定靶向性、增强内吞作用、活性药物控制
随着世界一体化的不断发展,对于竞技体育的全球化发展也越来越重视,因此对于竞技体育所表现的正义诉求以及产生的社会影响提出了更多机遇及挑战。运动竞赛规则作为影响竞技体
承销商与会计师事务所是IPO过程中最重要的中介机构,肩负定价和鉴证功能。当前的国内外学术研究大多侧重于讨论承销商、会计师事务所等中介机构在IPO过程中各自的行为及其经济后果,却甚少考虑中介机构之间的内在关系。实际上,我国IPO市场中一直存在着承销商与特定会计师事务所频繁合作的现象,承销商和会计师事务所在IPO业务中的共同服务会否形成利益联盟,这无论是对于监管IPO市场或是保护中小投资者的利益都有着
电动汽车在节能减排、促进可再生能源发电、保护环境等方面有着重要意义。但是电动汽车续航里程短、充电时间长、充电设施不完善等劣势阻碍了电动汽车的推广速度。电动汽车实
姚家岭锌金多金属矿床是近年来在铜陵矿集区内新发现的由斑岩型、矽卡岩型、脉型三种类型矿体共同组成的矿床,矿体多赋存在花岗闪长斑岩侵入体内的石炭-三叠系灰岩捕掳体及其
本文利用真空单辊快冷甩带法制备了两种不同成分(Ni50Mn35In15、Ni50Mn36In14)的Ni-Mn-In薄带,后续分别命名为NMI15、NMI14,同时利用Cu元素对Ni-Mn-In进行了掺杂,得到了成分
AZ91D是目前应用最广泛的铸造镁合金,其流动性好,且具有较宽的半固态温度区间,理论上适合进行近液相线挤压铸造。本文通过机械搅拌法制备了AZ91D镁合金浆料,并在近液相线温度
基于地质模型和动力学模型,利用数值模拟方法能够重现成矿动力学演化过程,实现对热液成矿系统的形成、矿化蚀变、动力学特征、矿床定位空间以及地球化学分布特征的定量化探讨
本文从Cu2+检测材料结构设计角度出发,分别以生物质桉木纤维和合成腈纶纤维为基体,采用化学接枝的方法在纤维上引入Cu2+识别基团,制备可选择性可视化识别Cu2+的功能检测纤维