论文部分内容阅读
随着大数据时代的到来,数据分析岗位一跃成为当今备受关注冉冉升起的新星,各行各业都需要具备数据分析技能的人才,然而就在数据分析岗位需求量日益增加的同时,还是有很多专业十分对口的应届毕业生存在就业困难的情况。因此本文旨在探究就业市场上数据分析人才的招聘情况,挖掘出企业方对于数据分析人才的要求,从而为学校的人才培养以及想从事数据分析岗位的求职者提供一些参考。本文从前程无忧招聘网站中爬取了11224条数据分析岗位招聘信息,首先,采用描述性统计,根据公司所有权性质、公司规模、行业分布三方面刻画需要数据分析岗位的公司,从公司、行业、地区三个角度比较数据分析岗位的需求量差异,从学历、工作经验、技能要求三方面看公司对数据分析岗位的具体要求,并探究不同地区、行业、公司的薪资差异;其次,对各个地区的岗位要求进行主题词提取,构建LDA主题模型,输出各地区对数据分析岗位的特征词,探究地区间的差异;最后,对岗位要求进行文本聚类,利用预训练的Word2vec模型对文本进行向量化,再使用Single-pass聚类,最后将各个类别的数据分析岗位从技能要求、地区分布、行业分布、薪资水平四方面进行比较。最后得出民营企业、中小型企业、互联网和制造业最需要数据分析人才,数据分析岗位主要集中在华东和华南地区,岗位对学历的要求不高,主要是最低本科或者大专,偏好于有1年工作经验者,对硬技能和软实力均有要求,高薪地区在华北、华东和华南,高薪行业是互联网和金融行业,高薪企业为民营和事业单位。主题模型从数据分析岗位要求中提取出“软实力”、“硬技能”和“岗位业务”三个主题,在“软实力”方面,经济发达的地区注重逻辑和数据敏感,欠发达地区注重领导力和执行力,在“硬技能”方面,除了华中地区外,其他地区均对计算机编程能力有高要求,各地区在“岗位业务”的关键词上无明显差异。文本聚类将数据分析岗位分成技术型和业务型,技术型集中分布在互联网行业,业务型散落在互联网、金融、制造业,在薪资待遇上技术型远高于业务型。根据以上结果,本文可以帮助致力于往数据分析岗位发展的求职者,有助于他们根据职业规划选择适合自己的岗位类型、想从事的行业、想发展的地区、选择何种性质和规模的公司,挖掘出技能要求等信息对于学校的人才培养也有一定的借鉴意义,从市场需求出发来培养符合市场要求的数据分析人才,可有效提高就业率。