数据类岗位需求及薪资影响因素分析

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:grchenpk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据人才缺口的增加,数据类岗位相关求职者竞争压力变大,网络招聘信息可以反应人才需求情况,比如用人单位对人才基本条件、素质和能力的要求等,通过对招聘信息的分析可以为求职者技能需求以及高校设置相关课程提供重要参考建议。另外,薪资作为求职者选择岗位的重要因素之一,通过对其影响因素的分析,求职者可以更清楚地了解就业环境和就业情况,并可通过公司以及自身条件预测现阶段的薪资水平。首先,本文使用后羿采集器对前程无忧和拉勾网的数据类岗位招聘信息进行爬取,抓取数据的时间周期为:2020年12月16日至2021年1月16日,共有15137条数据,收集的数据职位信息包括岗位名称、公司名称、工作城市、公司类型、行业领域、公司规模、岗位优势、工作经验、学历、薪资和职位描述等11个字段。采集的招聘信息中存在结构化数据和非结构化数据,对于结构化数据,通过数据清洗和数据变换等操作后,剩余13559条数据,然后对其进行可视化分析,分析各变量的招聘需求以及薪资情况。研究发现,数据类岗位在北京、上海、深圳等地分布较广并且工资均高于平均工资,另外,学历和工作经验在求职中也具有很大的优势。对于非结构化数据,采用中文分词和停用词进行处理,之后通过TF-IDF模型对岗位优势进行权重统计并利用LDA模型对职位描述进行主题提取,发现职位描述信息大概包含岗位业务、个人技能和工作福利三个主题。为了对个人技能有更加全面的了解,把职位描述关于技术的英文名词进行提取并统计,截取排名前20个技术名词,发现Python、Hadoop和Spark等是数据类岗位重要技术支持。其次,采用逐步回归、Lasso回归和随机森林模型对影响薪资的因素进行变量筛选,最终得到的显著性变量为岗位类别、公司类型、行业领域、学历和工作经验。将机器学习算法中随机森林、XGBoost和GBDT模型进行比较,发现XGBoost在薪资预测方面性能最好;然后,对XGBoost模型的参数进行优化,以获得最佳参数,并通过所选参数对变量特征进行重要性评分,得到薪资影响因素特征重要性排序为行业领域、工作经验、融资阶段、岗位类别、学历。为探讨各变量的影响效应,通过多元线性回归模型对变量进行量化分析。最后,综合以上分析结果对求职者和高校提供相关建议,对于从事数据类相关工作的求职者而言,应注重自身技能培养和了解数据类产业基本情况;对于高校培养数据类人才而言,应注重实际操作能力的培养以及增强与校外企业的合作。
其他文献
目的 探讨艾灸配合耳穴埋豆预防肛肠术后尿潴留的护理效果。方法 将2021年6月-2022年2月我院拟行肛肠手术治疗的100例患者,采用随机数字表法分为对照组和观察组,各50例。对照组采用常规护理,观察组采用艾灸配合耳穴埋豆护理。比较两组术后临床指标、护理满意度及尿潴留发生情况。结果 观察组护理总有效率高于对照组(P<0.05),观察组平均排尿时间及首次排尿时间均短于对照组(P<0.05),观察组护
<正>随着我国近些年医疗体系建设的不断完善,我国对医疗及制药人才的需求也在逐年增加,从而导致我国制药企业人力资源的竞争情况也日益激烈。在这样的背景下,我国制药企业需要不断提升人力资源培训的有效性,切实提升自身企业人才队伍的稳定性与专业水准,从而实现企业自身稳定可持续发展。制药行业相对于我国其他行业来说,面临着更加严重的人力资源培养与竞争的问题,因为制药从业人员的专业知识与技能需要大量的时间培养与实
期刊
演化时间不仅直接反应生物类群的进化历程,更能将丰富多样的各种生物在时间尺度上相互关联,所以在衡量生物的系统与进化关系中具有特殊的意义。近年来使用现有的化石记录与采用分子钟分析方法估算现生生物演化时间已较为成熟。真菌分类学中,在分子系统发育和表型特征的研究基础上,2016年以演化时间为新增指标构建分类系统的方法(“单系+表型特征+演化时间”)得以在蘑菇属的分类系统修订中首次实践,随后在真菌领域得以广
目前轻小型无人机被广泛应用于松材线虫病发生情况的监测和枯死木提取工作。本研究采用植被指数加入松材线虫病枯死木提取工作,计算Ex G指数、ExG-ExR指数和GLI指数,以三种植被指数分析其提取枯死木的阈值并统计枯死木提取情况,利用ArcGIS模型工具将工作步骤封装打包,便于基层林业单位直接使用。结果表明,ExG指数在提取枯死木时精度达90%以上,在三种指数中精度最高,模型工具相对人工目视解译速度提
为了探究山西省阳城地区煤矿采空区影响范围和地表历史形变过程,为工程建设提供避让依据,采用SBAS-InSAR技术对该地区2019年1月至2020年7月间的地表形变进行监测,分析地表沉陷的原因,利用同期水准监测结果验证了InSAR结果的可靠性。结果表明,SBAS-InSAR技术能及时监测到黄土地区采空沉陷区的动态变化过程,开采深度、停采时间和掘进位置是影响该地区地表沉陷变化的主要原因。
<正>随着信息技术和经济的不断发展,人们的生活节奏不断加快,市场的竞争也变得越发激烈。很多产品包装为了迎合这种快节奏的生活,常常忽略产品本身的内在含义,忽略了原本应该具备的文化内涵,加之外来文化的不断渗透,产品的包装设计失去了民族特色和文化底蕴,在这种形势下我们更需要植根于中华优秀传统文化之中,挖掘传统设计元素的设计潜力,在传统设计元素和包装设计之间找到融合点。中国传统水墨画这种艺术表现形式是中华
期刊
不同种类的新疆桑葚富含多种营养成分。为了解并掌握不同种类桑葚的营养成分,研究者应通过科学合理的实验方式,准确获得实际的信息数据,从而保证不同品种的桑葚最终显现的产品开发价值能够达到预期标准。基于此,本文详细概述了桑葚的主要营养、药用价值及其富含的各类矿物质、活性成分,并分析了新疆地区桑葚产品的开发价值。
不同蓝藻种类形成水华的条件不尽相同,因此,蓝藻水华过程中常出现不同优势种群的演替,增加了蓝藻水华生态效应的不确定性和复杂性.然而,关于蓝藻水华过程中优势种群内部的演替模式、生态效应及其驱动因素,尚未受到足够关注.因此,于2018年4月至9月对重庆市内饮用水源地南彭水库进行浮游植物群落动态和水环境监测分析.结果表明:(1)南彭水库共检出浮游植物8门59属108种,其中优势种4门13种,以拉氏拟柱孢藻