基于LSTM&Topic-CNN模型的医疗智能问答算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:quhaoshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的疾病患者通过在线医疗网站、医疗APP向医生寻求医疗建议。目前线上诊疗的主要方式仍然是患者在网络平台向医生留言,医生浏览信息后给出建议。然而这种方式往往不具有时效性,达不到线上诊疗的期望效果。能够实时回复、回复质量高的智能问答系统不仅可以帮助患者得到更科学健康的医疗建议,更可以节约大量的医疗资源,这也日渐成为当前医疗工作的重点内容。鉴于此,本文在深入研究问答系统以及在线医患对话文本特点的基础上,从社区问答和知识图谱两方面出发,构建了一套面向短文本对话的医疗问答系统。本文主要工作如下:(1)基于特征融合思想,通过将文本上下文语义特征与主题特征相结合建立了LSTM&Topic-CNN模型。一方面,采用word2vec方法获得分布式词向量,并利用长短时记忆(LSTM)模型抽取文本语义特征。另一方面,鉴于隐含迪利克雷分布(LDA)模型的主题数难以确定这一情况,通过子样本集敏感性分析实验得到表现最优的若干主题数目,进而得到基于LDA的主题特征。为了避免不同主题模型下主题特征冗余现象,采用一维卷积神经网络(CNN)对联合主题特征做进一步特征过滤。最后,通过将文本语义特征与主题特征进行有机融合来对患者问题进行相似性分析。利用python软件从39问答网、有问必答网采集在线医患对话文本构建实验数据集。结合开源中文医学科目词表,运用常用药品字典映射方法进行文本预处理。在此基础上,通过二分类与多分类实验验证LSTM&Topic-CNN模型的有效性。结果表明,本文模型与其他机器学习模型(SVM,RF,RNN,LSTM)相比,具有较高的召回率、精确度和F1值,进而反映了该模型具有较好的文本表征效果,间接验证了基于此模型的问答系统的可行性及有效性。(2)基于知识图谱理论,本章提出了一种改进的意图识别方法,并将其应用于心血管疾病的智能问答系统中。从寻医问药网的心血管疾病模块爬取相关数据,利用neo4j图形数据库构建并存储心血管疾病知识图谱。在此基础上,通过实体抽取和意图识别两种方式解析患者问句。首先,结合常用药品词典,采用字符串匹配方法进行映射抽取患者问句的实体特征。其次,基于意图触发词及LSTM&Topic-CNN模型,从主观规则判断以及客观定量分析两个方面来识别患者问句意图。对于包含意图触发词的患者问句,通过主观规则直接得到患者意图。针对不包含意图触发词的问句,通过LSTM&Topic-CNN模型得到其相似问句后,根据主观规则判断得到患者意图。最后,基于实体抽取与意图识别的结果,在心血管知识图谱中的回复模板查询并得到最合适的回答。
其他文献
近年来,全球化石能源的使用呈阶梯式增长,间接加重了人们生存环境的恶化,冰川融化、酸雨、雾霾等给人们的生存带来了巨大的困扰。可再生能源里的风能、水的势能、太阳能、潮汐及地热能的使用给人们的生活带来了益处,但除太阳能以外的其他能源均受地域限制,大范围内难以推广。太阳能的利用几乎不受地域限制,每个地区都能获得足够的太阳能,其分布范围广、收集简单、成本低廉、无污染等特点受到各国专家的青睐,逐渐成为清洁能源
公司实际控制人是事实上能够支配公司行为的人,在公司治理中处于核心地位。目前,我国公司法对于公司实际控制人的诚信义务未作出明确规定,相关法律责任也尚待健全。本文从公司实际控制人的概念界定出发,通过分析公司实际控制人对公司、股东、债权人承担诚信义务的原因,以及诚信义务的内容,在此基础上分析公司实际控制人应承担的法律责任。论文共分为四个部分:第一部分对公司实际控制人概念从三方面界定。首先界定主体范围,并
基于长期演进(Long Term Evolution,LTE)技术承载信息传输的《城市轨道交通车地综合通信系统(LTE-M)规范》要求通信系统在1785MHz~1805MHz专用授权频段进行布网。由于安全要求的提高和智慧地铁的发展,车地间需要传输的数据大幅增加,目前的20MHz频谱带宽逐渐难以满足传输需求。随着免授权频段长期演进(LTE in unlicensed,LTE-U)技术的发展,可利用的
计算机、互联网技术的飞速发展,极大地拓展了人们获取信息的渠道,有效促进了多样化信息的共享。然而,面对海量、复杂信息,人们在体验互联网便捷性的同时,也日益发现高效获取有用信息变得更加困难。为了缓解信息过载问题,推荐系统应运而生并迅速发展为电商平台、社交媒体等领域信息精准推送的关键支撑。然而,需要强调的是,尽管学术界、产业界围绕推荐系统取得了系列重要研究进展,但是,数据稀疏性仍然是其面临的重要挑战之一
钢桥具有刚度大、自重轻、跨越能力强、建设周期短、使用寿命长、碳排放量低等优点,已在桥梁工程建设中得到广泛应用。近年来,国内外学者对桥梁全寿命周期成本分析理论及钢桥防腐维护方法开展了大量的研究工作,而对基于不同防腐维护策略的钢桥全寿命周期成本及结构可靠性的研究较少。本文以景中高速与中川机场连接线主匝道高架桥为案例,利用理论分析和数值模拟的方法,对不同防腐维护策略作用下,钢桥全寿命周期成本和结构可靠性
钢桁腹式混凝土组合箱梁的典型节点有钢盖箱节点、双套管节点和PBL节点,其中PBL节点是主要依靠PBL剪力键来抵抗水平剪力的新型节点。在荷载作用之下,混凝土弦杆所受轴力在此突变,致使PBL节点区产生轴力差,同时在钢管腹杆上分别产生压力和拉力,导致节点产生平动与转动变形等复杂变形,为了研究该类节点抵抗变形的能力,以某工程实例为背景,结合有限元模型,本文对以下几个方面展开了研究:(1)基于组件法,根据假
波形腹板钢底板组合箱梁是将传统波形钢腹板组合箱梁的混凝土底板换成了平钢底板的一种新型桥梁结构。其受力更加合理,重量更轻,跨度更大。钢底板和波形钢腹板可以工厂预制拼装进一步加快施工进度。该桥型已经在甘肃省内的桥梁建设率先投入使用。因此,对这种混凝土顶板-波形钢腹板-钢底板的新结构研究具有重要意义和价值。本文依托甘肃省2019年重大科技专项“公路新型钢混组合桥梁建造成套技术研究及产业化”通过试验和有限
在游泳培训开展如火如荼,发展愈加迅速地当今时代,水域安全事故却仍屡见不鲜,并未到良好把控,据报道,溺水事故在青少年意外死亡原因中的比例达到了近四分之一。许多媒体反映出有关于游泳培训机构中学员自身安全意识和技能薄弱、教员选拔不够严格、管理人员管控不全面以及家长平时的安全灌输不到位等一系列问题,均对游泳培训行业的长远发展非常不利。本研究将采用文献资料法、问卷调查法、访谈法、数理统计法、逻辑归纳法以及实
学位
学位