【摘 要】
:
过去几十年,Web数据随着互联网的迅猛发展不断激增,如何有效地从这些难以计数的Web数据之中挖掘隐藏的、有价值的信息并加以利用,已成为当前数据挖掘领域的研究热点。另一方面,据调研,仅有10%的大学生第一次就业时找到了完全适合自己的工作。这反映了当前高校大学生对所学知识与工作内容的契合度没有充分的了解。而企业也长期存在精准定位招聘人才难,招聘成本高、周期长、效果差,留住人才难、人才沟通难等问题。针对
论文部分内容阅读
过去几十年,Web数据随着互联网的迅猛发展不断激增,如何有效地从这些难以计数的Web数据之中挖掘隐藏的、有价值的信息并加以利用,已成为当前数据挖掘领域的研究热点。另一方面,据调研,仅有10%的大学生第一次就业时找到了完全适合自己的工作。这反映了当前高校大学生对所学知识与工作内容的契合度没有充分的了解。而企业也长期存在精准定位招聘人才难,招聘成本高、周期长、效果差,留住人才难、人才沟通难等问题。针对上述问题,本文提出两个Web数据挖掘算法,并通过实际调研,从当前学生和企业的普遍痛点入手,以茶歇文化为媒介,设计搭建了一个用于高校与企业的人才对接的系统平台。同时将两个Web数据挖掘算法融入其中,以持续改善用户使用体验。论文主要工作有:(1)提出一种新的基于图模型的岗位信息文档关键词提取算法以挖掘当前热门的关键词。该算法使用传统的TextRank提取出来的关键词构造顶点,以时间和点击量两个因素计算边权重,最后进行随机游走不断迭代提取出关键词。(2)提出一种改进的AprioriAll算法从Web日志中挖掘用户的偏好路径。该算法减少了数据库的扫描次数,并通过先验地剪除不满足最小支持度的侯选项集的方法仅生成有效的候选项集。实验表明,相比原算法,改进后的AprioriAll算法具有更低的时空复杂度,挖掘性能得到了提升。(3)使用Spring Boot+Mybatis+Vue.js全栈技术完整地实现了一个校企人才对接系统平台,并利用上述算法实现了岗位关键词提取和用户偏好路径挖掘模块。最后对系统进行了功能和性能测试,结果表明Web数据挖掘算法提升了校企人才对接的效率。
其他文献
目的:通过对比肉眼组及加用皮肤镜组在我科室不同年资临床医生诊断非色素性皮肤病的准确率差异,以及各组之间诊断准确率提升的差异,探讨皮肤镜在不同年资临床医生组的临床应
19世纪末20世纪初,正是晚清政府摇摇欲坠的时期。此间,国家内外交困,吏治腐败,官僚管理体系混乱,清政府试图通过学习西方制度来挽救危亡的统治,下令广开言路,制定了一系列变
患者女,51岁,上肢、腹部起疙瘩1月。皮损进展相对缓慢,无伴随症状。皮肤科情况:上肢、腹部皮肤可见米粒至黄豆大小肤色扁平丘疹,质地较软,互不融合,部中皮疹以毛囊为中心。扁
目的:线粒体DNA疾病是致病性线粒体DNA(Mitochondrial DNA,mt DNA)突变引起的线粒体功能障碍性疾病。线粒体替代治疗可以预防致病性mt DNA向子代的传递。虽然临床已有通过核
目的:参麦注射液(Shen-mai Injection,SMI)是临床上常用的中药注射剂,为红参和麦冬水提液。参麦注射液广泛用于治疗心肌梗死、心律失常、心肌纤维化等心血管性疾病;此外,联合
目的:探讨单髁假体置换术与后交叉韧带保留型假体全膝置换术治疗承德地区中老年人膝关节内侧间室骨关节炎的近期疗效。方法:回顾性研究自2017年1月至2019年2月在承德医学院附
目的:了解石家庄地区321例2型糖尿病患者足浅部真菌感染的危险因素与患病率,以及糖尿病足与足浅部真菌感染的关系。方法:本研究通过调查问卷调查、查阅病历的方式对研究对象
背景:急性缺血性脑卒中包括脑血栓形成和脑梗死,脑血栓形成是其主要的病理过程,脑血栓是由于大脑动脉发生动脉粥样硬化后,出现血管管壁内膜粗糙,血管管腔狭窄,当出现血压降低
【研究背景】膀胱癌是泌尿系统最常见的恶性肿瘤之一,近年来,我国膀胱癌的发病率逐年升高,而且它是一种没有明显症状,容易复发的疾病。褪黑素是松果体内分泌的吲哚胺激素,之
目的:如今对冠心病的诊断方法有很多,多以冠脉造影作为金标准,横向对比其他诊断方法来评价其对冠心病诊断的临床意义。而心肺运动试验对冠心病诊断的临床意义并不多见,同时关