基于集成学习的数据岗位招聘薪资影响因素分析及预测

来源 :苏州大学 | 被引量 : 0次 | 上传用户:ansonx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随“大数据”时代的到来,网络招聘逐渐成为校园和社会招聘的重要媒介。网络招聘很好地缓解了招聘信息传输不及时的问题,但是也造成大量招聘信息堆积,求职者就业迷茫现象。在海量的招聘信息中,薪资往往是求职者关心的重要因素。本文基于时下热门的大数据岗位入手,借助于招聘网站的招聘信息,实现网络招聘薪资影响因素分析和预测。本文爬取51job网站的大数据岗位招聘信息作为样本数据;对多维度数据进行特征工程,内容包括文本处理、数据预处理、构建特征和变量重编码等;采用描述统计和交叉分析实现可视化,初步探索薪资与特征关系;再使用Word2vec优化LDA模型,实现文本聚类和主题特征构建;基于voting融合XGBoost、LightGBM和CatBoost实现回归预测并分析数据岗位薪资影响因素。分析结果显示,大数据岗位人才需分布不均衡,以发达城市、本科、有经验为主,且存在高学历、经验丰富、企业规模大,薪资水平高现象。Word2vec优化LDA模型,开发、分析、产品、运营等文本主题特征鲜明。引入主题特征,基于Voting建立融合型薪资预测模型实现降方差。影响程度因素排名为:职位因素>地域因素>企业因素>福利因素>主题因素>计算机技能。其中福利因素的补贴类福利,主题因素的经验主题、业务主题和团队技术,以及计算机技能的PYTHON、AI、HADOOP、BI、SQL、SPARK和SASS等重要性程度明显。最后基于网络招聘的三方即求职者、招聘企业和招聘平台,分别提供参考意见。包括求职者依据自身条件选择岗位,招聘企业务必保证信息真实有效,招聘平台实名制认证招聘企业,防范非恶意传播虚假招聘信息,完善用户问题反馈机制,提升用户的体验感等。
其他文献
概率极限理论是概率论的主要分支之一,是概率统计和概率论其他分支的重要理论基础.完全收敛、矩完全收敛等概念的提出,为极限理论研究者提供了新的方向.经典的概率极限理论以独立随机变量为主要研究对象,之后人们逐渐突破独立性假设的限制,展开了对相依关系的探索.人们不断提出许多相依关系:NA、ρ*混合、ρ-混合(ANA)、m-渐近负相依(m-ANA)等,并且结合极限理论,拓展了许多经典的结果.本文主要应用随机
学位
磁共振成像(MRI)作为临床疾病诊断中重要的影像学方法,具有空间分辨率高、穿透深度无限制、软组织分辨能力出色等优势。目前,Gd基小分子螯合物是临床普遍用于增强MRI对比度的造影剂,但其中大部分受限于较低的纵向弛豫率(~3.4 mM-1s-1,3.0 T)、较短的血液循环时间(~90 min,清除半衰期)和由于Gd3+离子释放而诱发肾源性系统纤维化(nephrogenic systemic fibr
学位
在应用科学中,许多问题都涉及系统在亚稳态之间发生状态迁移这类稀有事件.此类问题的主要计算目标是状态迁移路径和过渡态.弦方法(string method)简单有效,是计算梯度系统中状态迁移路径(最小能量路径)和过渡态(系统能量的鞍点)的高效数值方法,在许多领域均有广泛的应用.我们将弦方法推广到一类带质量约束的非局部Allen-Cahn系统,给出了计算该系统的状态迁移路径和过渡态的数值方法.非局部模型
学位
吲哚及吲哚啉衍生物是自然界中分布最广泛的氮杂环化合物。由于其对生命体具有广谱的生理和药理活性,吲哚及吲哚啉衍生物已成为制药工业和学术研究过程中优先筛选的靶向分子结构。在过去的几十年里,各种天然或是人工合成的吲哚及吲哚啉衍生物不仅被用作治疗与中枢神经系统相关疾病的药物,而且也被开发为具有多种活性的抗癌剂。因此,发展简洁高效的合成方法构建各种含有手性吲哚及吲哚啉骨架的化合物具有重要的研究意义。在第一部
学位
本文主要研究Fock-Sobolev空间Fαp,m上的积分算子,以及其上的Gauss-Bargmann逆变换的映射性质.首先我们讨论了由整函数Φ(z,w)诱导的积分算子SΦf(z)=∫cΦ(z,w)f(w)dGα(w),?z∈C的算子论性质.我们证明了 SΦ:Fα1,m→Fαp,m(1 ≤p ≤∞)有界当且仅当(?)并证明了 1<q≤∞,1≤p≤∞时,(*)式不是SΦ:Fαq,m→Fαp,m有界的
学位
数学概念课是高中数学课主要课型之一,具有教育潜能与价值,但实际教学中很少教师重视概念的生成过程.现象教学作为一种新型教学模式,以“终身学习”为教学理念,以“身心共育,立德树人”为教学目标,为改变传统概念课教学带来希望.因此,本文旨在研究如何基于现象教学设计数学概念课教学,并对其实施效果进行探讨.首先,依据文献资料,提炼出初步的基于现象教学的高中数学概念课教学设计框架,经过专家调查问卷的分析后进行修
学位
目的:分析血清腱生蛋白c(tenascin-c,TNC)、alarin水平在成人2型糖尿病(type 2 diabetes mellitus,T2DM)合并动脉粥样硬化性心血管疾病(arteriosclerotic cardiovascular disease,ASCVD)患者中的变化,并探索其临床意义。方法:在这项横断面研究中,随机选取250例住院T2DM患者,根据其冠心病、脑血管病和外周动脉疾
学位
在“指数函数”课堂教学中,存在知识理解不深刻、技能掌握薄弱等问题.建构主义是教师帮助学生学习新知识的主要方式的理论基础.因此,将建构主义学习理论应用于“指数函数”课堂教学中可以尝试着解决上述问题.本研究从国家教育资源公共服务平台上选取了江苏省的26节优质视频课作为研究对象.首先,在文献分析的基础上,本研究构建了“指数函数”教学行为观察量表;随后,使用NVivo质性分析软件和SPSS统计软件,从定性
学位
目的 探讨经内镜逆行胰胆管造影(endoscopic retrograde cholangiopancreatography,ERCP)取石术后胆总管结石复发的相关危险因素,尝试构建结石复发的列线图风险预测模型,并进行验证,以便早期识别高危患者。方法在2017年1月—2020年12月之间至苏州大学附属第一医院消化内科住院行ERCP治疗的胆总管结石患者共计813例,根据纳入及排除标准筛选后,有665
学位
随着信息技术的不断提升,教育改革的不断深入,人们对于教育的关注越来越密切.在这一过程中,人们也逐渐意识到课堂教育教学的重要性.想要提高课堂教学的有效性,对教师和学生在课堂中的教学行为进行研究很有必要.本研究从国家教育资源公共服务平台“一师一优课”上选取了江苏省的30节优质视频课作为研究对象,从定量和定性的角度对其进行了研究.研究过程分为六个部分.第一部分是绪论,主要是确定研究背景、研究问题、研究意
学位