基于深度学习的网络招聘文本命名实体识别研究

来源 :北京建筑大学 | 被引量 : 0次 | 上传用户:chicagousa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络招聘文本命名实体识别是指从网络招聘文本中识别出特定的信息,例如技能,学历,工作经验等要求。在信息资源爆炸的大数据时代,求职者需要耗费大量的时间精力对招聘文本进行梳理才能总结出招聘企业对人才的要求。对网络招聘文本进行命名实体识别并进行分析,一方面可以帮助求职者掌握工作岗位的具体需求,另一方面对网络招聘领域推荐系统和知识图谱的构建也有重要意义。因此本文将网络招聘文本作为研究对象进行基于深度学习方法的命名实体识别研究。本文的主要研究内容如下:(1)针对传统命名实体识别模型对网络招聘文本实体识别效果不佳的问题,提出改进的Bi GRU-ATT-CRF模型。将LSTM网络替换为GRU网络可以降低模型的复杂度,通过添加注意力机制使模型更加灵活。与传统命名实体识别模型相比,Bi GRU-ATT-CRF模型实体识别效果有一定提升。(2)针对传统命名实体识别模型对复杂实体特征提取能力弱的问题,提出RSBC模型。RSBC模型通过增加实体识别模型中神经网络的深度以提高模型提取深层特征的能力,并通过残差连接解决随着网络深度增加出现的网络退化问题。与传统实体识别模型相比,RSBC模型进一步提升了实体识别效果。(3)针对网络招聘文本中一词多义现象导致的实体类型识别错误问题,提出BERT-Bi GRU-CRF模型。使用基于BERT预训练语言模型生成的字向量进行文本表示,再通过Bi GRU-CRF模型训练字向量。与传统命名实体识别模型相比,BERT-Bi GRU-CRF模型在网络招聘文本中取得了最好的实体识别效果。实验结果表明,本文提出的三种模型与传统实体识别模型Bi LSTM-CRF相比,F1值分别提升了4.93%,6.77%和10.07%,取得了最好的实验效果。
其他文献
著名教育学家陶行知说过:"发明千千万,起点在一问"。由此可以看出问题的重要性,它是激活学生思维的重要工具之一,是培养高思维技能学生的重要手段。因此,作为教师在数学课堂中,要善于开发问题资源,开展问题化教学,让数学课堂变得更加高效。
舰船目标检测对于维护我国领土安全和合法权益、促进渔业健康发展具有重要意义。SAR图像由于其优秀的图像特性已成为舰船目标检测的重要数据来源。随着合成孔径雷达的发展,数据量不断增多,传统算法已无法满足实时检测的需求。尽管基于深度学习的检测算法可实现实时检测,但此类算法主要针对光学图像,在SAR图像上检测效果并不理想。并且,深度学习的目标检测算法需要大量标注样本,而SAR图像相较于光学而言数据量少且标注
随着我国最近几年互联网迅猛发展,例如当下的大数据、云计算、物联网等与之相关的科学技术也逐步深入到人们的日常生活中,潜移默化地影响着人们的生活。同时也促使数据资源日渐丰富,推动分析技术逐步完善和成熟,为数据驱动下的游客时空特征分析、景区客流规律探究、关联景点提取、游客潜在出行需求发现等研究提供了理论支撑。与传统问卷调查相比,采用海量、多样、真实的大数据可以有效提升工作效率,保证数据收集的精准性。因此
水泥稳定碎石材料因承载能力强、取材方便等优点一直作为我国高等级公路路面基层的主要材料,但水稳基层并非完美,因荷载、使用年限等因素影响,水稳基层的结构功能会逐年衰减,致使孔隙-裂缝等问题出现,孔隙-裂缝继续发育扩展形成down-up裂缝,降低路用性能,因此为提高水稳材料的服役性能,强化长寿命路面设计理念,本文采用单轴荷载作用模拟荷载作用,研究水稳基层孔隙裂缝发展机理。(1)设计N1、N2两组级配水稳
粗集料作为沥青混合料的主要组成部分,其形态特征会对沥青混合料的力学强度和路用性能造成显著影响。间接方法常被用来评价粗集料的形态特征,其主要基于手工测量、肉眼识别和简单试验,在控制集料质量方面具有一定作用,但只能做定性评价。本文采用激光扫描采集集料颗粒的三维点云数据,获取集料颗粒的完整三维信息,快速、定量、精确评价了粗集料的形状、棱角和纹理特征。首先利用图像处理技术研究粗集料二维形态特征。在白色工作
随着科学技术的发展,大跨网架屋盖结构被大量的应用于机场、体育馆和会展中心等大型公用建筑。大跨网架屋盖结构具有结构整体质量轻、跨度大、刚度小和阻尼低等特点,属于典型的风敏感性结构。在网架屋盖结构型式中,悬挑屋盖(平板型网架)的风敏感程度较高,其挑檐端受气流的分离作用,角部挑檐端承受较大的吸力,因此应重点考虑脉动风荷载对其角部挑檐处产生的风振影响。本文以某体育馆的悬挑屋盖为研究对象,针对悬挑屋盖角部挑
导航定位与国防建设、社会生态发展、经济高质量转型、民生水平提升等息息相关,是数字中国、智慧城市建设的重要位置信息支撑。随着北斗三号全球卫星导航系统建设完成,厘米级定位精度使室外位置服务趋于成熟,但GNSS信号无法穿透墙体覆盖占人们70%-90%活动时间的广阔室内或地下空间,导致室内导航定位发展滞后,不能满足日益增长的广泛需求。本文针对复杂室内/地下场景高精度定位问题深入探究,研究UWB高精度定位模
地震作用可能造成结构不同程度的损坏甚至是倒塌,因此进行大量抗震研究并推出了抗震规范来指导结构的抗震设计。现有的抗震设计和理论研究大多是针对地震动的平动分量,而忽略了地震动转动分量对于结构可能产生的影响。随着抗震研究的不断深入和技术水平的提升,对于地震动转动分量的研究正日益提上日程。本文介绍了国内外对转动分量及其对结构响应的研究现状,获取地震动转动分量的理论方法,利用频域法由地震动平动分量获取了转动
高速铁路的发展与国家经济息息相关,无砟轨道是我国高速铁路的主要选择,而轨道板是无砟轨道的重要组成部分。无砟轨道经过雨水的浸泡,水从CA砂浆与轨道板的离缝中渗入,致使CA砂浆层的有机-无机相发生反应,从而引起CA砂浆弱化以致开裂,同时在高速列车荷载作用下,使CA砂浆层中的水经过荷载作用下进而对砂浆层产生横向冲刷,导致CA砂浆产生劈裂损伤甚至完全破坏。CA砂浆的劣化损伤,然而轨道板在CA砂浆劣化下的损
城市近郊乡村地区在经济产业和意识形态方面都受到城市的深刻影响。一方面,城市产业转移和城乡设施互通首先惠及这类地区,加速了其城镇化进程;另一方面,随着越来越多本地青壮劳动力的流出和大量外来人口的涌入,城市近郊乡村出现人口混居状态,传统农村社会关系和空间形态都发生了显著变化。这种情况在经济吸引力强、就业机会多的大城市边缘更加突出,北京近郊乡村正是这类地区的典型代表,由“人口混居”造成的社会结构变化直接