【摘 要】
:
伴随着医疗信息化水平的快速提高,越来越繁杂的数据制约了人们检索数据的效率。如何设计一个合适的问答系统为人们的生活提供便利就成为了迫切的需求。其中,对医学领域内所存在的大量医疗知识和医疗数据进行深度挖掘与整合就是一个关键的任务。知识图谱作为医疗垂直领域应用的典型代表,通过对数据进行高精度与高质量的建模可以为其提供有力支撑。本文阐述了一个问答系统的构建过程,并在此基础上对于涉及到的意图分类,命名实体识
论文部分内容阅读
伴随着医疗信息化水平的快速提高,越来越繁杂的数据制约了人们检索数据的效率。如何设计一个合适的问答系统为人们的生活提供便利就成为了迫切的需求。其中,对医学领域内所存在的大量医疗知识和医疗数据进行深度挖掘与整合就是一个关键的任务。知识图谱作为医疗垂直领域应用的典型代表,通过对数据进行高精度与高质量的建模可以为其提供有力支撑。本文阐述了一个问答系统的构建过程,并在此基础上对于涉及到的意图分类,命名实体识别等技术进行研究与改进。该系统面向医疗领域,从人们日益增长的疾病问诊的需求出发,组建了一个大型知识图谱网络,并通过微信聊天问答的方式进行设计与实现。系统在帮助用户快速的了解身体健康状况的同时,还可以加强用户对有关的疾病认知,做到在宏观上把握病情,在微观上做出决策。在一定程度上,该系统还可以起到辅助医生进行医疗知识介绍与普及的作用,让用户对于后续的实际就诊更有信心。本文的主要工作包含以下几点:(1)完整地构建了一个基于医疗垂直领域的知识图谱,其中包含了8种实体与11种实体关系,共计35000个。过程主要分为数据的采集,信息的提取,知识的融合与加工等步骤,针对不同的数据源,具体的方式是通过常用的网络爬虫到各大高质量医疗数据网站抓取半结构化数据,利用命名实体识别方式抽取非结构化文本实体,最后利用图形数据库存储数据。(2)研究并设计了对于用户问题的意图识别方法。其中包含非医疗意图识别与医疗意图识别两大类。针对5类非医疗意图,主要采用了GBDT与LR模型相结合的方式来完成,系统通过爬虫获取常见医疗问答数据共6000多条进行训练,实验证明融合模型优于二者的单一模型及其他分类模型,适合用于意图识别与分类。(3)完成并改进了针对用户问题中医疗实体的提取方法。模型在采用BiLSTM-CRF命名实体识别模型的基础上,结合了AC自动机这一多模式字符串匹配方法,通过综合二者得分机制共同对实体进行抽取。系统针对用户的输入设计了共计11类医疗命名实体,通过中文医学问答数据集c Med QA共计30多万条数据进行训练。实验证明融合模型有效的增强了抽取性能。在此基础上,本文搭建了一个基于微信平台的医疗问答系统,通过相关测试测试分析显示,本系统可以较好的完成用户基本的医疗问诊需求。
其他文献
近年来,化石燃料的使用增加,出现了严重的能源和环境问题。有效利用太阳能资源被认为是解决这些问题的一种可行的方法。正因为如此,在利用可见光的前提下,利用半导体光催化剂通过水的分解产氢和污染物的降解,引起了科学界的极大兴趣。石墨氮化碳(g-C3N4)是一种多聚非均相无金属半导体光催化剂(带隙~2.7e V),广泛用于水处理。g-C3N4的制备,可采用的材料十分丰富,且其在可见光区具有良好的光学吸收,易
目的:本文旨在探讨本中心急性心肌梗死(AMI)患者发生心力衰竭(HF)的发病情况及临床特点,分析不同射血分数类型HF的影响因素,以期协助早期识别高危患者,指导临床进行及时诊断及有效治疗。方法:根据纳排标准选入2018年1月到2019年12月入院的AMI患者367例,根据HF诊断标准识别在院期间并发HF的患者,计算早期HF发病率;收集HF患者的基线资料、发病情况、冠状动脉造影相关信息、实验室检查、心
三伏贴主要由白芥子、延胡索、细辛以及甘遂等药材组成,由于三伏贴可以治疗多种疾病,且不良反应较少,近年来受到广泛关注。三伏贴通过选取不同的穴位治疗不同疾病,主要包括支气管哮喘、变应性鼻炎、慢性支气管炎等疾病,但长期使用会产生皮肤损伤等不良反应,因此有研究人员制备了三伏贴的不同剂型以此来降低不良反应。本文在中国知网数据库中以“三伏贴治疗”为主题检索2010—2022年期间的相关文献,对三伏贴的临床应用
研究背景与目的由于气候变化和人类活动,蓝藻水华在世界范围内的发生逐年增加,由此产生的次生代谢产物——微囊藻毒素(Microcystin,MC)对水生态系统与公众健康构成严重威胁,其中微囊藻毒素-RR(Microcystin-RR,MC-RR)是亚洲湖泊和河流中发现的最主要的MC变体,结构为环状-(D-Ala~1-Arg~2-D-Me Asp~3-Arg~4-Adda~5-D-Glu~6-Mdha~
近年来,各级各地公安机关不断深化“放管服”改革,认真贯彻中央办公厅、国务院办公厅《关于深入推进审批服务便民化的指导意见》和公安部《关于进一步深化“放管服”改革推进审批服务便民化的实施意见》等文件精神,在提高各职能部门服务人民群众上持续发力。交警是人民群众高度关注的公安职能部门。其中交警窗口是服务人民群众的高频平台,是公安机关为公众提供服务的最直接渠道,是公安交警联系群众、密切警民关系的桥梁和纽带。
S-CO2超临界二氧化碳(supercritical carbon dioxide)循环发电是采用S-CO2取代水蒸气作为循环工质的一种新型发电方式,具有结构紧凑、对金属腐蚀性小、发电效率高等优点,是目前能源动力领域的研究热点。在国家重点研发计划(2017YFB0601800)的支持下,1000MW级S-CO2燃煤发电锅炉的系统设计已经初步完成,但炉内NOx等污染物生成特性及超低排放方案仍然需要进
在对智能建筑弱电工程项目进行建设的过程中,为了确保施工的稳定性,相关人员会将工程分为多个系统来进行完成,也包括了排水系统与消防系统等。在智能建筑工程进行建设施工的过程中,弱电工程作为其中一项较为重要的工程,相关施工人员在对此项目进行施工时也要更加地重视,一旦此环节施工出现失误,将会对整个建筑的功能造成极其严重的影响。此外,其也会对后续的各个施工环节造成一定程度的影响。因此在进行施工时,施工人员不仅
工业遗产作为城市遗产文化的重要组成部分,其保护利用影响着城市的转型进度及发展,因此日益受到广泛重视。我国目前已有较多工业遗产改造实例,采用的改造手法不尽相同,但其改造再利用后是否能更好地体现自身价值?是否能满足使用者的使用需求?便不得而知。因此有必要对工业遗产保护改造进行使用后评价。南京作为近代时期中国最重要的城市之一,近现代工业遗产资源丰富,笔者选取其中具有代表性的由金陵兵工厂旧址改造而成的晨光
为了减少城市道路信号交叉口中右转机动车与直行非机动车之间的交通冲突,维持交叉口交通秩序,提高交叉口运行效率,保障交叉口交通安全,本文通过分析信号交叉口右转机动车与非机动车的交通特性以及机非交通流之间的交通冲突规律,来确定信号交叉口右转专用相位的设置条件、方法等。其次,本文通过取用整体优化的思路,全面考虑机动车、过街行人和非机动车等不同交通方式间的协调关系,并选取机动车延误时间、过街行人延误时间、非
骨干级路由器散热系统对散热性能和应用可靠性均有很高的要求,从散热能力方面来看,液冷性能最佳,风冷其次,自然散热最低;而应用可靠性方面,液冷可靠性最低,风冷其次,自然散热最优。综合来看,强迫风冷的散热方式在散热性能和应用可靠性方面均有着不错的表现,同时结合业界主流厂家在解决骨干级路由器散热上基本采用的是强迫风冷的形式,本文采用强迫风冷的散热方式,研究其在高功耗密度的骨干级路由器系统的散热解决方案。所