基于文本挖掘的数据分析岗位人才需求分析

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:gengyunshe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据分析岗位一跃成为当今备受关注冉冉升起的新星,各行各业都需要具备数据分析技能的人才,然而就在数据分析岗位需求量日益增加的同时,还是有很多专业十分对口的应届毕业生存在就业困难的情况。因此本文旨在探究就业市场上数据分析人才的招聘情况,挖掘出企业方对于数据分析人才的要求,从而为学校的人才培养以及想从事数据分析岗位的求职者提供一些参考。本文从前程无忧招聘网站中爬取了11224条数据分析岗位招聘信息,首先,采用描述性统计,根据公司所有权性质、公司规模、行业分布三方面刻画需要数据分析岗位的公司,从公司、行业、地区三个角度比较数据分析岗位的需求量差异,从学历、工作经验、技能要求三方面看公司对数据分析岗位的具体要求,并探究不同地区、行业、公司的薪资差异;其次,对各个地区的岗位要求进行主题词提取,构建LDA主题模型,输出各地区对数据分析岗位的特征词,探究地区间的差异;最后,对岗位要求进行文本聚类,利用预训练的Word2vec模型对文本进行向量化,再使用Single-pass聚类,最后将各个类别的数据分析岗位从技能要求、地区分布、行业分布、薪资水平四方面进行比较。最后得出民营企业、中小型企业、互联网和制造业最需要数据分析人才,数据分析岗位主要集中在华东和华南地区,岗位对学历的要求不高,主要是最低本科或者大专,偏好于有1年工作经验者,对硬技能和软实力均有要求,高薪地区在华北、华东和华南,高薪行业是互联网和金融行业,高薪企业为民营和事业单位。主题模型从数据分析岗位要求中提取出“软实力”、“硬技能”和“岗位业务”三个主题,在“软实力”方面,经济发达的地区注重逻辑和数据敏感,欠发达地区注重领导力和执行力,在“硬技能”方面,除了华中地区外,其他地区均对计算机编程能力有高要求,各地区在“岗位业务”的关键词上无明显差异。文本聚类将数据分析岗位分成技术型和业务型,技术型集中分布在互联网行业,业务型散落在互联网、金融、制造业,在薪资待遇上技术型远高于业务型。根据以上结果,本文可以帮助致力于往数据分析岗位发展的求职者,有助于他们根据职业规划选择适合自己的岗位类型、想从事的行业、想发展的地区、选择何种性质和规模的公司,挖掘出技能要求等信息对于学校的人才培养也有一定的借鉴意义,从市场需求出发来培养符合市场要求的数据分析人才,可有效提高就业率。
其他文献
开展同塔四回750 kV 6层横担输电线路电晕损失的研究有利于同塔四回线路的电晕损失评估以及工程应用。为此,利用有限元分析软件计算了750kV同塔四回6层横担输电线路各相导线
Z12井区地处鄂尔多斯盆地陕北斜坡中部,主力生油层位为长6油层组。为了更好的探究Z12井区的储层特征,洞悉地下砂体展布规律,本文对Z12井区长6储层进行了三维地质建模研究。选
公交站点作为重要的城市公共交通设施,是公交车辆在公交线路上中途停靠,以供乘客安全上下车的场所。位于城市老城区的公交站点,由于建设年代早、道路环境变化大、地面交通出
随着社会经济文化水平的不断发展和提升,市场竞争也越演越烈,为了提升自身竞争力,占领更大市场份额,赢得发展先机,不少企业积极探索转变管理模式,将先进的管理方法和理论运用
伴随着信息时代的到来,网络消费者个人信息的地位日益提升,如何在保护个人信息与网络交易健康发展之间寻求最佳平衡点是目前我们所面临的难题。对网络消费者而言,网络交易的