基于多特征融合的中文疾病名称归一化研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:fdghghjhghjjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对在线健康社区疾病名称存在多种指称的问题,提出基于多特征融合的中文疾病名称归一化模型.[方法]基于在线健康社区构建中文疾病名称归一化数据集;采用LSTM、GRU和CNN模型进行中英文对照实验,利用Word2Vec和GloVe生成外部语义特征向量,并通过CNN模型进行验证;最后在自注意力机制基础上,提出多特征融合的中文疾病名称归一化模型MFCF-CNN,更好地利用全局和局部语义特征.[结果]实验表明,在中文数据集Accuracy@10指标上,MFCF-CNN模型准确率可以达到85.48%,较CNN基础模型提高8.84%.[局限]所构建的数据集规模较小,需要进一步增加数据量以体现模型泛化性.[结论]进一步推动了中文疾病名称归一化研究,为中文医学知识图谱构建和自然语言理解提供帮助.
其他文献
黔东南苗族侗族自治州位于贵州省东南部,海拔高纬度低,气候温凉,昼夜温差大,适宜马铃薯生长,大部分地区一年四季均可种植马铃薯,是我国马铃薯主产区之一。随着马铃薯产业的规
抗病优质新品种是蔬菜高效生产和可持续发展的保证,为了筛选出适宜福建省莆田地区种植及满足市场需求的优质、高抗番茄品种,对12个红果番茄杂交新组合进行评比。结果表明,组
<正>果寡糖(fructooligosaccharides,FOS)通常特指聚合度为3-5果糖低聚体, 即1-蔗果三糖(1-kestose,GF3),蔗果四糖(nystose,GF4),和1F-果糖基蔗果四糖(GF5)。果寡糖口感似蔗
会议
作为北京市最大的“菜篮子”,3月20日新发地市场蔬菜供应量已经达到2.03万t,恢复到节前水平。新发地市场董事长张玉玺介绍说,目前新发地市场98%商户已经复工,北京市蔬菜供应
综述了六方氮化硼(h-BN)/纳米纤维素(CNF)导热复合材料的制备方法,并通过激光闪射法测试了复合材料的导热系数(K),预测了其导热性能。通过比较不同制备方法制备的复合材料的
当前,宿迁农机化处在跨入高级阶段的新时期,要保证农业机械化工作与四化同步发展,必须大力推进农机社会化服务工作。如何更好地发挥农机社会化服务新优势,更好地服务于农业农