基于知识图谱的医疗知识搜索研究

来源 :浙江理工大学 | 被引量 : 12次 | 上传用户:gsfv85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网信息的爆发式增长,既为用户带来了丰富的信息知识,也为用户从中筛选所需知识造成了困难。传统的搜索引擎基于对互联网数据的全文索引,通过关键词匹配索引的方式为用户返回相关信息的链接,而不是直接明确的知识点,用户仍需从返回的大量冗余链接中查找并提炼自己所需的知识。如何从海量的、结构多样化的信息中有针对的为用户返回精确信息,已成为当前知识搜索的研究热点。知识图谱技术的兴起为该研究提供了新的解决思路。知识图谱能够以一种更直观的方式表达出现实世界中的实体的信息以及实体和概念之间的关联。本文将互联网文本数据作为语料资源,对其进行知识图谱构建的研究。本文研究了知识图谱构建中的序列标注问题。在该问题上,本文采用了长短期记忆(LSTM)网络结构,为保留训练过程中更多的特征信息,提出用预训练词向量和微调词向量扩展LSTM结构单元的D-LSTM模型。此外,为了应对医疗领域标注文本稀疏的情况,本文在D-LSTM的基础上结合Co-training半监督的方法,提出改进模型CTD-BLSTM,通过迭代训练进一步提升识别效率。本文用Python编写了CTD-BLSTM算法,并设置本文模型与原始BLSTM的对比实验以及用完整数据集训练的对比实验,验证了本文方法具有更好的识别效果和适应性。最后,以此为基础实现了中文医疗领域知识图谱的构建。本文基于构建的中文医疗领域知识图谱,用Java语言设计实现了医疗知识搜索系统。该系统通过对用户输入的自然语言进行句法分析和语义依存分析等处理,识别用户的搜索意图,借助知识图谱,以一种更加直观、精确的方式返回用户所需的知识。
其他文献
甘肃河西走廊是中国最大的杂交玉米种子生产基地,干旱、缺水是制约该区玉米制种产业发展的瓶颈因素。对6种不同栽培模式下制种玉米的产量表现和水分利用效果进行对比研究,结
目的:探讨人性化护理在慢阻肺无创呼吸机护理中的应用效果。方法:选用2015年7月至2017年7月期间我院救治的慢阻肺患者44例为研究对象,给予无创呼吸机治疗,均分为两组,对照组
随着我国经济的飞速发展以及社会主义现代化建设的逐步完善,国家电力行业得到了前所未有的进步,智能电网的建立和电网高级量测系统的应用已经成为了大势所趋,其中的关键技术就是实现用户侧信息可靠接入。以无线通信多址接入技术和自组织网络理论为核心的环节,是物联网体系基础能够有效运行,并解决技术难点的重要手段。但是在实际运行过程中,由于用户侧环境的复杂多样性,经常使无线信道受到阻碍,重新传送率大幅增多。对此,我
以宁波市宁海县为例,以社会网络分析为基础理论,利用Ucinet6.0对宁海县旅游大数据平台中的节点线路模块数据进行处理,并结合Arcgis10.3空间可视化手段,探究微观尺度旅游流移动规
本文从植物神经和胃肠激素两方面介绍消化道运动调节研究的一些进展。现时认为,在调节消化道运动的交感神经和副交感神经以及壁内神经丛中,均有兴奋性神经和抑制性神经。近年
以美丽异木棉、爪哇木棉、海南木棉叶片为测试材料,利用3051D光合作用测定仪测定3种木棉光合作用日变化规律,分析其相关性,并通过光合速率计算固碳量,从而得出三者碳汇能力.