多准则融合的中文命名实体识别方法

来源 :东南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:dd2010875
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高中文命名实体识别任务的识别率,提出了一种多准则融合模型.采用基于字的BERT语言模型作为语言信息特征提取层,将其接入多准则共享连接层和条件随机场(CRF)层,得到融合模型.建立大规模中文混合语料库,优化模型参数,使用单GPU设备完成BERT语言模型的预训练.将融合模型在MSRA-NER和RMRB-98-1实体标注集上进行独立训练和混合训练,得到各语料库独立的单准则中文命名实体识别模型和多准则融合中文命名实体识别模型.结果表明,多准则融合中文命名实体识别模型能够挖掘语料库间的共有信息,提高中文命名实体
其他文献
针对1例住院患者中药煎剂发药错误事件,应用RCA^2进行改进.首先,将患者置于安全的环境下,基于风险的优先等级评估,成立RCA^2团队;然后,寻找事件发生事实,建立因果关系,明确行
在可持续发展观的引领下,我国的营林技术水平得到了飞速提升,为促进林业的良好发展发挥了积极的作用。在林业经营的过程中,病虫害一直是较为严重的问题,对林木的正常生长及林
论述了中子和原子核相互作用的几种反应,利用各反应在时间上的差异,采用双门减本底的测量方法来测量非弹性散射γ谱.利用碳、氧的非弹性散射γ射线能量高、能量差别大的特点,
结合高速公路工程实例,根据半刚性基层的施工特点,提出异步连续摊铺施工工艺,体现在原材料质量控制、摊铺、压实及养护等环节。所得结果表明,水稳碎石基层施工质量达标,在保
对不少“病号”而言,睡觉前除了洗漱,还有一件必须做的事——吃药。睡前吃的药有一定特殊性,也可能带来特定的风险。