基于知识图谱的慢病智能问答系统研究与设计

来源 :江苏大学 | 被引量 : 0次 | 上传用户:cxcsmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
慢病因起病隐匿、病程长、并发症多已成为医疗领域的重灾区,为大众普及慢病知识对慢病防控、减轻社会医疗负担起着积极作用。知识图谱因可以有效表示客观世界中各种事物的联系被广泛使用。基于知识图谱的问答系统在理解用户意图的基础上提供简洁、准确的答案。论文针对知识图谱构建和问句解析技术进行深入研究,旨在构建一个慢病知识图谱,并在此基础上实现智能问答。论文主要研究内容如下。(1)基于自顶向下的慢病知识图谱构建。以适合行业知识图谱构建的自顶向下方法完成慢病知识图谱构建。分析网页数据后,定义知识图谱概念层。设计基于拼接URL的网络爬虫获取初始数据。通过数据清洗得到格式化数据,并存储到Neo4j图数据库,成功构建了一个包含2411种慢病的知识图谱。(2)基于字词联合的BiLSTM-CRF命名实体识别模型研究。针对字向量语义信息表示不足和词向量会忽略词内字的语义信息问题,提出字词联合的向量表示优化方法,同时利用模型BiLSTM和CRF实现上下文特征学习和标签约束。最终提出基于字词联合的BiLSTM-CRF问句医疗实体识别模型。模型训练过程中,针对医疗问句标注语料缺乏的问题,设计基于规则的自动标注语料生成器。实验结果表明论文识别模型较常用识别模型性能有很大改善,获得了90.08%的准确率和88.95%的召回率。(3)基于text CNN的问句分类模型参数设计。论文采用模板匹配方式实现问答,模板匹配是将解析后的问句转换为Cypher数据库查询语言,并根据问句分类结果对答案进行自然语言包装,问句精准分类是问答成功的关键。针对问句多分类问题,论文以文本分类模型text CNN为基准模型,对模型主要参数filter_size进行优化实现问句分类。实验结果表明filter_size为(3,4,5)时,模型性能较好,测试数据在此参数下整体分类准确率大于80%,部分达到90%以上。(4)基于Flask的智能问答原型系统实现。为验证论文问句解析技术的有效性,使用Flask框架搭建了智能问答原型系统,并使用300条慢病问句对系统核心问答功能进行测试,测试准确率达到96%,充分证明了论文整体问句解析技术的有效性和系统设计的可行性。
其他文献
在我国,小麦产量占粮食产量约1/5,但小麦在运输和储存过程中极易发霉,甚至产生毒素,尤其是黄曲霉毒素。亟需建立一套成熟的感染黄曲霉产毒菌小麦霉变程度早期检测方法。本研究以黄曲霉毒素主要来源之产毒黄曲霉与不产毒黄曲霉感染小麦为研究对象,采用复合纳米色敏传感器技术,建立一种用于早期检测感染黄曲霉产毒菌小麦霉变程度的方法,具体研究内容如下:(1)黄曲霉产毒菌产毒规律分析。实验采用国标方法同位素稀释液相色
本文的研究在国家自然科学基金“含沙水条件下水力机械空化特性及磨蚀机理研究”(项目编号:51979126)的资助下展开。离心泵广泛应用于黄河流域,在输送混合多种粒径泥沙的水流时,泥沙颗粒的存在会与过流壁面发生摩擦碰撞,造成其磨损破坏,严重影响离心泵运行的稳定性与使用寿命。针对离心泵磨损问题,本文以离心泵为研究对象,通过试验与数值模拟的方法,研究了流量、泥沙浓度与泥沙颗粒物性等对离心泵过流部件磨损的影
PVDF是一种重复单位为[CH2-CF2]n-的半结晶聚合物,其本身具有优异的压电性、生物相容性及高表面积,能够负载抗菌剂制备成复合薄膜。薄膜可将抗菌药物输送到伤口部位以控制感染,其本身的压电性对细菌活性也具有一定影响。本文采用3D打印制备PVDF复合薄膜,通过改变辅助电压,PVDF的质量分数等参数,探讨打印参数对薄膜制备的影响,选取最合适的打印参数;通过负载多种抗菌剂,以大肠杆菌为检测菌种,探究
随着农业信息化与智能化发展,图像拼接技术在农田作物监测、喷雾机器人作业等方面起到重要作用。传统的图像拼接方法存在拼接速度慢、匹配准确率低、重影等问题。为了解决这些问题,本文利用植株的彩色和深度双源信息,研究了喷雾机器人靶标图像的准确快速拼接方法,主要研究内容总结如下:(1)设计了喷雾机器人靶标图像拼接的实验平台。根据靶标图像拼接需求,在喷雾机整机结构的基础上,配置了RGB-D传感器、微型嵌入式计算
硅氧化物负极材料被认为是下一代商业锂离子电池中极具应用前景的负极材料之一。本文针对非化学计量比硅氧化物负极材料在充放电过程中的体积效应比较严重,长时间循环后会造成材料发生粉化和破碎,导致循环寿命急速下降,以及其本征电子电导率较差的问题提出了无定形碳和Li3BO3双重包覆、采用CNTs与金属锡构建三维导电网络结构、制备Ni-MOF多孔材料来改善材料的循环稳定性和倍率性能,主要结果如下:(1)采用改进
如今的妇科病患病率愈来愈高,年龄愈来愈低。随着人们更加注重自身健康管理,互联网中医学相关服务和网站也随之增多,海量的医学数据不断产生。如何整合互联网和医学文献中专业医学知识成医学知识图谱,为妇科患者提供优质的诊断服务成为了关键问题。在众多知识表示方式中,知识图谱作为一种语义网络拥有极强的表达能力和建模灵活性,而知识图谱构架的前提则是知识的建模。论文基本思路,围绕妇产科学知识进行妇科知识特征的抽取,
研制高能量转化效率的新型功能材料以及能量收集装置,发展新的环境能量收集技术以实现小型集成化电子装置能源自给,对于我国绿色能源利用、智能制造升级尤为必要。敏感于应变梯度的挠曲电效应广泛存在于介电材料中,具有绿色环保、无需预极化、对材料的结晶程度以及工作温度等均无特殊要求等优势,在驱动、传感、能量收集等领域具有广泛的应用前景。本文以挠曲电单晶悬臂梁结构为研究对象,通过结构动态特性分析挠曲电悬臂梁的结构
随着社会经济飞速发展,人们生活水平日益提高,现代人越来越关注自身的健康问题,想要通过各种运动来达到强身健体的效果。其中球类运动(羽毛球、网球、乒乓球等)深受广大健身爱好者喜爱。同时,随着Kinect在人体骨骼追踪算法上的突破和深度学习的兴起,使得基于关节点数据和深度学习方法的人体姿势识别的研究逐渐成为了一个新的研究趋势。目前球类运动的姿势识别在动作复杂性和研究数据方面都有很大的挑战性,同时该研究也
肝脏是人体腹部最大、且最为重要的器官之一,其一旦病变极易诱发肝癌。肝癌的死亡率位居世界第六位、位居我国第二位,常被称为“癌症之王”。在临床医学中,采用CT扫描的医学影像常被用于肝病的筛查、诊断与随访。由于大部分肝脏病灶在CT图像中呈现低密度影的特点,使得医生难以对病灶的性质做出正确判断。随着人工智能技术的快速发展,基于深度学习技术实现的肝脏肿瘤分类算法在疾病筛查、病灶随访及干预治疗等方面起着重要作
现代社会在大力发展经济的同时,也造成了一系列危害,如工业产生的烟尘、烟雾,植物撒药施肥产生的挥发性有毒气体等。这些有毒有害气体不仅对环境产生污染,而且对人类的身体和生活造成巨大伤害,因此开发灵敏度高、成本低廉、携带方便、稳定性能高的气体传感器,能够及时有效地检测污染源,以采取监控防御措施。气体传感器的优异性能与气敏材料的微观结构和形貌密切相关,普通的单相气敏材料已远远达不到人们当前的检测需求。基于