论文部分内容阅读
健康是生活中最受人们关注的问题之一。当前经济飞速发展,生活水平不断提高,各种不良的生活习惯也随之产生,这导致健康问题日益突出。定时进行健康体检有利于帮助了解情况,保持生命的健康活动。随着信息时代的到来,网络上的健康信息也越来越丰富,越来越多的人通过互联网搜索关心的健康问题。但目前网站上各类健康信息鱼龙混杂,主观性较强,缺乏一定的针对性,现有健康体检信息系统缺乏给用户提出个性化的中医健康服务方案;其次,人们对健康的追求也逐渐提高,已由疾病治疗转变治疗预防。知识图谱可以捕捉各个领域的零散及杂乱的数据并以接近于人类的认知思维对这些数据进行组织和理解,为网络上海量复杂的医疗数据提供管理和使用。基于此,本文设计并开发了基于知识图谱的健康体检知识问答系统,有助于患者在海量的健康信息中获取的个性化健康体检服务。本文主要研究内容如下:(1)基于自然语言处理技术构建健康体检知识图谱。本文基于某中医院体检中心的中医四诊数据,采用自顶向下的方法构建知识图谱。首先,采用自然语言处理技术对体检中心的中医四诊数据及网络爬取的中医症状、证候、方剂、药物等数据进行处理,采用基于RI+Word2vec+BiLSTM的方法作为命名实体识别算法识别健康体检相关数据的实体、实体之间的关系及实体包含的属性,然后将定义好的三元组存储在Neo4j图数据库中构建健康体检知识图谱,其中知识图谱包含7类实体,8种实体关系。(2)构建基于知识图谱的健康体检知识问答模型。首先对提问者的提问进行语义解析,使用SVM非线性支持向量机分类器对用户提出的问句进行分类,进行用户意图识别,通过问句分析让系统理解问句的语义,然后使用Neo4j图数据库自带的cypher语句查询功能去检索问句的答案。健康体检知识问答结果分别采用基于规则模板匹配与基于相似度匹配,并将精确率、召回率与F1值作为评价指标评估两种算法的效果,实验证明基于相似度匹配的知识问答效果最好。(3)设计并开发健康体检知识问答web网页,采用智能问答的形式实现健康体检后续服务。利用Flask框架作为web应用程序框架包装健康服务,通过浏览器访问的形式将健康体检知识问答服务可视化,从而实现人机交互的功能,为用户提供健康的相关知识问答服务。