【摘 要】
:
[目的]针对在线健康社区疾病名称存在多种指称的问题,提出基于多特征融合的中文疾病名称归一化模型.[方法]基于在线健康社区构建中文疾病名称归一化数据集;采用LSTM、GRU和CN
【机 构】
:
南京邮电大学管理学院 南京210003;江苏省数据工程与知识服务重点实验室 南京210023;南京邮电大学管理学院 南京210003
【基金项目】
:
国家社科基金项目(项目编号:17CTQ022);江苏研究生科研创新计划基金项目(项目编号:KYCX20_0844)的研究成果之一
论文部分内容阅读
[目的]针对在线健康社区疾病名称存在多种指称的问题,提出基于多特征融合的中文疾病名称归一化模型.[方法]基于在线健康社区构建中文疾病名称归一化数据集;采用LSTM、GRU和CNN模型进行中英文对照实验,利用Word2Vec和GloVe生成外部语义特征向量,并通过CNN模型进行验证;最后在自注意力机制基础上,提出多特征融合的中文疾病名称归一化模型MFCF-CNN,更好地利用全局和局部语义特征.[结果]实验表明,在中文数据集Accuracy@10指标上,MFCF-CNN模型准确率可以达到85.48%,较CNN基础模型提高8.84%.[局限]所构建的数据集规模较小,需要进一步增加数据量以体现模型泛化性.[结论]进一步推动了中文疾病名称归一化研究,为中文医学知识图谱构建和自然语言理解提供帮助.
其他文献
黔东南苗族侗族自治州位于贵州省东南部,海拔高纬度低,气候温凉,昼夜温差大,适宜马铃薯生长,大部分地区一年四季均可种植马铃薯,是我国马铃薯主产区之一。随着马铃薯产业的规
抗病优质新品种是蔬菜高效生产和可持续发展的保证,为了筛选出适宜福建省莆田地区种植及满足市场需求的优质、高抗番茄品种,对12个红果番茄杂交新组合进行评比。结果表明,组
<正>果寡糖(fructooligosaccharides,FOS)通常特指聚合度为3-5果糖低聚体, 即1-蔗果三糖(1-kestose,GF3),蔗果四糖(nystose,GF4),和1F-果糖基蔗果四糖(GF5)。果寡糖口感似蔗
作为北京市最大的“菜篮子”,3月20日新发地市场蔬菜供应量已经达到2.03万t,恢复到节前水平。新发地市场董事长张玉玺介绍说,目前新发地市场98%商户已经复工,北京市蔬菜供应
综述了六方氮化硼(h-BN)/纳米纤维素(CNF)导热复合材料的制备方法,并通过激光闪射法测试了复合材料的导热系数(K),预测了其导热性能。通过比较不同制备方法制备的复合材料的
当前,宿迁农机化处在跨入高级阶段的新时期,要保证农业机械化工作与四化同步发展,必须大力推进农机社会化服务工作。如何更好地发挥农机社会化服务新优势,更好地服务于农业农