基于数据增强的中文医疗命名实体识别

来源 :北京邮电大学学报 | 被引量 : 0次 | 上传用户:ssddhwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于缺乏大量已标注数据,在中文医疗命名实体识别中,主要利用外部资源来改善医疗实体识别的性能,这需要大量的时间和有效的规则加入外部资源.为了解决标注数据不足的问题,提出了一种基于生成对抗网络的数据增强算法,自动生成大量标注数据,提高医疗实体识别的性能.实验结果表明,该算法在性能方面优于实验中的基准模型,证明了该算法在医疗实体识别上的有效性.
其他文献
多绳摩擦式提升系统以其适应深井、提升能力大的特点,应用越来越广泛.在超过千米的深井提升中,所用钢丝绳绳径也越来越大,钢丝绳结构也由传统的三角股向8股、多股抗旋转钢丝
作为“瓷都”,我们对于陶瓷再熟悉不过.但应用防护装甲的陶瓷并不等同于我们日常使用的陶器或瓷砖。相对于其他防护装甲,陶瓷装甲具有硬度高、质量轻的优点,其对动能弹和弹药破片
为了利用商品文本标题实现商品自动分类,提出一种基于高层特征融合的商品分类模型.首先,提出基于字嵌入和词嵌入的文本底层特征表示法,进而获得更强的商品标题结构特征表达;
多宝山铜矿属于典型的低品位斑岩型铜钼矿,现已形成了8万t/d选矿处理能力.分析总结了多宝山铜矿选矿工艺及装备,指出了选矿工艺与装备的优势特点及创新特色,对比了近年来选矿