论文部分内容阅读
世界卫生组织曾出不健康的饮食是诱发癌症、心血管疾病、糖尿病等一系列慢性疾病以及其它与肥胖相关病症的主要危险因素。健康的饮食不仅可以降低某些的疾病的发生概率,还可以在疾病发生后对病症进行调理以改善身体状况;近些年来公众也越来越多的关注健康合理的膳食,并试图在搜素引擎上获取符合自己需求的膳食信息,或借各种来源不明的推送消息获取健康膳食知识。党的十九大更是基于此作出实施―健康中国‖战略的重大决策,将维护国民健康升到国家战略的高度。政府相关部门为公众供关于健康膳食知识的信息服务则是实施―健康中国‖战略的一项重要举措,而一个科学、有效的智能问答系统则是当前比较先进的信息服务模式之一。传统的问答系统都是通过关键词的匹配来返回答案,无法解析用户的语义信息,且不具备逻辑性,因而无法满足用户的需求。知识图谱在分析事物时,创新的从―关系‖角度切入,通过该方式,基于知识图谱的健康膳食知识智能问答系统能够精确的解析用户输入的原始问题的语义;并正确、迅速的以人类友好的方式反馈给用户所需的答案和相关知识。文章首先使用Python Scrapy爬虫框架在百度百科网站中爬取健康膳食的相关数据,将爬取到的数据和《名老中医药李乾构亲授食疗秘方-食物卷》中的内容作为构建健康膳食知识图谱的知识来源;然后分别通过CRF++工具和Deepdive关系抽取项目对知识源进行了命名实体识别和关系抽取,最终使用Neo4j图数据库成功构建了健康膳食领域的知识图谱,该知识图谱共包含1294个与健康膳食相关的节点和2069个三元组。同时以该健康膳食知识图谱为数据支撑研发了一个健康膳食知识智能问答系统。首先对健康膳食知识问答系统进行系统设计和技术路线分析,然后使用HanLP分词器对用户出的原始问题进行分词和关键特征取,再使用基于Spark的朴素贝叶斯分类器对原始问题进行分类匹配,基于匹配结果和关键特征,再去图数据库Neo4j中查找答案,文章研发的健康膳食知识智能问答系统使用Spring-Boot完成整体系统框架研发,待系统研发成功后,可实现与用户交互式的智能问答功能。最后通过运行展示与实验测试相结合的方式对研发的健康膳食知识智能问答系统的功能实现状况进行了验证,并测试了系统的实际使用效果。经过测试,系统可实现在系统设计阶段预先设定的八大功能;系统实际使用满意率达到了65%,距离真正投入市场使用还有一定的改善空间。