基于ALBERT的中文医疗病历命名实体识别

来源 :南京师范大学学报:工程技术版 | 被引量 : 0次 | 上传用户:sjn19900523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗病历命名实体识别的主要任务是将临床电子病历中的非结构化文本转化为结构化数据,进而为面向医疗领域任务开展的数据挖掘提供基础支撑.提出一种基于ALBERT模型融合学习的中文医疗病历命名实体识别模型.首先,采用人工标注方式扩展样本数据集,结合ALBERT模型对数据集进行微调;其次,采用双向长短记忆网络(BiLSTM)提取文本的全局特征;最后,基于条件随机场模型(CRF)命名实体的序列标记.在标准数据集上的实验结果表明,该方法进一步提高了医疗文本命名识别精度,减少了时间开销.
其他文献
卡尔曼综合征(KS)是伴有嗅觉减退或缺失的低促性腺激素型性腺功能减退症(IHH),占IHH的40%~60%,是一种罕见的先天性疾病。据报道,男性患病率为1/8000,女性患病率为1/40000,男
【摘 要】在小学语文阅读教学中,为了提升学生的阅读兴趣,教师要充分利用图文并茂的绘本,引导学生掌握阅读方法,并拓展延伸,运用到纯文字类作品的阅读中。教师要指导学生在观察图片中发现问题,在角色扮演中体验情感,并设置悬念,鼓励学生想象。这些方法都有助于提升学生阅读的有效性。  【关键词】绘本;阅读教学;小学语文  绘本指以绘画为主,含有少量文字说明的书籍,是一种儿童喜闻乐见的文学读物。在小学语文阅读教
通过大田对比试验,研究露地和温室大棚2种种植模式下,不同氮素用量对常州地区甘蓝产量及土壤理化性状的影响。结果表明,在磷、钾肥用量相同的情况下,氮肥用量比常规施肥分别
针对藏文现代图书版面中的文本行分布不均匀、现代藏文字体差异较大的问题,提出了一种基于Faster R-CNN的版面文本行检测算法。通过在整理标注的数据集上训练,用ResNet-50网络提取出藏文现代图书版面特征信息。为了有效提高模型的泛化能力,在COCO数据集下的网络模型中进行迁移学习。实验结果表明,该方法可对藏文现代印刷物的版面实现文本行的定位,检测准确率为83%,召回率为95%,明显提高了版面
在其他条件相同的情况下,探索通过增施有机肥后相应减少化肥使用量对玉米产量的影响。结果表明,在测土配方施肥的基础上每亩增施300 kg商品有机肥同时相应减少化肥施用量10%
网站易成为黑客入侵篡改的对象,网站的实时变更监测对于网站安全尤为重要.针对目前大规模进行网站实时变更监测的难点,设计并实现了一种基于非关系型数据库和消息机制的网站
【摘 要】随着人们生活水平的不断提高,物质需求得到了极大的满足,同时人们在快节奏的生活中,身体逐渐出现亚健康问题,尤其是心理问题。在初中阶段,学生的心理发育和生理发育都到了重要时期,学业的压力、人际关系和学习成绩等因素都对学生的心理发展造成了影响。初中生作为心理问题高发的群体,教师要随时关注学生的变化,及时与学生进行沟通,解决学生的心理问题,促进学生心理健康发展。本文将主要阐述提升初中生心理健康教