基于python的Web数据挖掘技术研究与实现

来源 :长江大学 | 被引量 : 33次 | 上传用户:y810417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,大数据时代的来临,数据挖掘在从海量数据中探查潜在的价值信息起到了重要的作用,成为当下热门的研究和实践方向之一。python作为数据挖掘领域中较为热门的程序语言,其丰富的技术库和强大的科学计算能力成为数据挖掘过程中不可或缺的工具。本次研究主要是基于python语言对智联招聘网的数据进行数据挖掘分析和建模,进而得出招聘信息薪资待遇预测分类模型。本次研究主要分为如下步骤:数据源选择、数据采集、数据存储、数据预处理、数据建模和模型评估,通过算法构建了近邻和决策树两种分类模型,其次对两种模型的混淆矩阵数据进行计算,比较模型的预测准确率,最终得出准确率较高的数据模型。本次研究所得的分类模型,可以帮助被招聘者在浏览网站招聘信息时预测薪资待遇水平,有效的评估招聘内容是否合适,以及对招聘岗位提供的薪资待遇是否感到满意,进而有效的提高求职者在寻求招聘岗位时的效率。同时,该模型对于企业优化招聘信息也起到反馈性作用。企业可以根据模型对市场中现有招聘信息薪资水平进行有效分类,从而得到市场不同岗位的薪资水平分布现状,进而对企业招聘内容进行合理的调整,提高企业招聘效率,节约招聘成本,优化企业人才结构,提高企业在行业的竞争力。
其他文献
时下,无论是大中专院校的日常教学,还是汽车经销公司的内部培训,通常把汽车产品介绍放在首位,而对于汽车需求分析则不太重视,似乎可有可无。就笔者看来,这种做法有失偏颇。端
近年来旅游产业竞争力正逐渐成为国内外研究的热点领域,本文通过对国外相关研究文献的梳理与回顾,对旅游产业竞争力的相关影响因素、评价方法和模型、存在问题以及未来研究趋
杂环结构组成了最庞大最多样的有机化合物家族。他们不仅存在于大量具有生物活性的天然物质、药物和农用化学物质的分子结构中,而且是重要的有机合成中间体,广泛应用于天然产物
突破性创新是建立在一套不同的科学技术原理之上,通过在产品、工艺或服务领域的变革,改变市场规则和竞争态势,甚至导致整个产业的重新洗牌的一类创新。可见,突破性创新是企业
<正> AO2、BO2、CO2、DO2系列分马力异步电动机是全国推广应用的统一设计新产品,量大面广。经多年生产实践,证明这四个系列设计是合理、可行,基本符合我国国情的。 由于设计
物业服务随着我国房屋的市场化改革而兴起,并且随着物业服务企业在各城市住宅小区的进驻而不断为人们所熟知。本文的物业服务特指城市商品房住宅小区中,聘请专业化的物业服务企
保税港区作为物流体系中重要的支点,具有发展第三方物流得天独厚的优势和条件。因此研究基于保税港区的第三方物流运作模式具有重要的理论和实用价值。本文重点探讨了基于重庆
遗传药理学(pharmacogenetics)是研究人体遗传变异引起的药物代谢酶、药物转运体和药物作用靶点功能异常,导致药物代谢和效应个体差异的一门科学。遗传药理学从基因角度来解
《侵权责任法》第十章第78条至第84条规定了饲养动物致害责任,其沿袭了《民法通则》第127条之规定并有所发展和创新,构成动物致害责任的外部体系。我国动物致害责任体系是混合