【摘 要】
:
随着知识付费时代的来临和用户对线上教育认可度的不断提升,在线课程从传统的大规模免费公开课逐渐发展为付费的课程形式。现阶段,以付费课程为主的新兴网站和传统网站都在探索获利模式,课程量的繁多也对用户选择造成困扰。研究在线课程定价对增加网站收益、储存用户和促进平台发展具有重要意义。本文利用腾讯课堂网站上“IT互联网”类课程数据,建立课程价格的统计模型和算法模型,对课程价格区间进行预测。具体工作概述如下:
论文部分内容阅读
随着知识付费时代的来临和用户对线上教育认可度的不断提升,在线课程从传统的大规模免费公开课逐渐发展为付费的课程形式。现阶段,以付费课程为主的新兴网站和传统网站都在探索获利模式,课程量的繁多也对用户选择造成困扰。研究在线课程定价对增加网站收益、储存用户和促进平台发展具有重要意义。本文利用腾讯课堂网站上“IT互联网”类课程数据,建立课程价格的统计模型和算法模型,对课程价格区间进行预测。具体工作概述如下:1.收集和处理数据。利用python爬取腾讯课堂网站上“IT互联网”类课程数据,对原始数据进行缺失值、异常值、数据变换、归一化处理、衍生变量构造和数据不平衡问题处理等数据清洗和数据构造,使获取的原始数据变成有效建模数据。2.数据的描述性统计分析。通过条形图和经验累积分布函数图查看课程类别和销量特征;分析课程上线和下线时间点特征;绘制课程简介和机构简介词云图,挖掘课程的热门词汇,分析开课机构的共同关注点。3.构建IT互联网类在线课程价格的多项逻辑斯谛回归模型。通过构建多项逻辑斯谛回归模型对数据不平衡问题处理前后的在线课程价格区间进行预测,对比两种预测结果准确率,并对模型作出评价。4.构建IT互联网类在线课程价格的算法模型。使用k近邻、决策树、支持向量机、随机森林、XGBoost等算法模型,通过网格搜索选取最优参数,使用准确率、AUC值和F1值对模型效果进行评估,对变量进行重要性排名以分析课程价格的影响因素。结果显示,在该数据集上支持向量机和随机森林的模型性能最优,在测试集上准确率分别为96.54%和96.46%。本文通过网络爬虫获取数据,合理处理和利用了数值类型和文本类型变量,将数据挖掘方法用于在线课程价格区间预测的研究中,选取支持向量机和随机森林模型作为最终价格预测模型。该结果在一定时间段内,可为用户评估课程价格提供数据参考,同时也对开课机构优化价格区间起反馈性作用。
其他文献
目的和背景 周围神经是分化成熟组织,放射敏感性较低,属晚反应组织,其放射性损伤一般发生较迟,既往大多数学者认为周围神经对放射线较抗拒,对放射性周围神经损伤认识不足,随着放
随着近些年来网络技术、特别是物联网技术的高速发展,智能家居监控系统应运而生,成为当下网络界普遍关心的领域。作为“智能家居监控系统”研究课题的一部分,本文旨在通过对
1926年《孙行者大战金钱豹》开启了《西游记》改编电影的历史。由于时代、技术等原因,不同阶段的《西游记》改编电影呈现出不同的特征。从1994年《大话西游》开始,《西游记》
目的探究银川市社区卫生机构的流动孕产妇及儿童保健服务的提供现状,为完善流动孕产妇和流动儿童保健管理提供参考依据。方法采用个人访谈和问卷调查方式,了解社区流动孕产妇
十九大报告提出,赋予自由贸易试验区更大改革自主权,探索建设自由贸易港。自由贸易港将如何建设,成为业界讨论和市场关注的焦点。$$谈及自由贸易,让人更多想到的是自由贸易试验区
酸雨和全球变暖是当今世界正面临的环境污染问题,SO2和CO2分别是引起酸雨和全球变暖的主要原因。随着社会经济的快速发展,含碳、硫化石燃料的大量燃烧向大气中排放了无可估量
太阳能作为最主要的清洁能源,是国家十三五规划的能源发展方向。在太阳能光伏电站建设前需要进行合理的规划,进行电站的选址,只有这样才能合理的利用太阳能资源。为了更加准确地进行电站位置的拟定,本文将地理信息系统(Geographic Information System,即GIS)运用到太阳能光伏电站选址的过程中,实现对某区域太阳能资源的空间、属性数据的统一管理。利用GIS系统中的缓冲区分析以及叠置分析
城市轨道交通作为城市公共交通的重要组成部分,以其快速、准时、安全、污染低等特点,越来越受到居民出行的青睐,同时也成为了城市发展的象征。新建地铁运营企业,在运营前期的筹备阶段,要充分考虑运营企业的发展模式,确定组织架构,同时也为后续工作提供保障。在运营前期,选择合适的组织架构,结合地铁运营公司发展战略规划,确定职能部门及岗位,保障地铁运营公司开通后的高效、安全发展。目前,我国大多数轨道交通企业的组织
建立了化妆品中4种生育酚异构体及α-生育酚乙酸酯的超临界色谱分析方法。不同基质类型的化妆品经乙腈水溶液-正己烷溶剂体系按不同的添加顺序进行分散、提取、液液分配后,以
耐药性、新的疾病、超级细菌盛行的当下,如何快速、有效的寻找到有用的生物活性物质,进一步开发成药物,是目前人类面临的最大挑战。动物粪便放线菌是一类开发较少的资源,本研