论文部分内容阅读
随着“互联网+医疗”的政策不断推动,市场上以患者为中心的医患问答平台越来越多,人们现在可以轻松的在网上进行一些医疗咨询与疾病诊断。但是目前还是存在许多问题,比如各个医患问答平台的数据不互通、平台医生的质量良莠不齐、不能在用户有限时间内回答问题、医生根据片面的描述容易误诊等。本文通过市场调研和分析,开发一个在B/S架构下的医疗问答检测与推荐系统,该系统使用命名实体识别算法和链路预测算法,来实现诸如问答分析、疾病自查、历史记录检索、误诊疾病预测、疾病预测等功能。不仅如此,系统还可以进行新的疾病、症状以及问答记录的更新,可以让系统不断注入新数据。具体来说,本文主要有以下几个方面工作:首先,利用java的htmlunit工具类,针对目前使用频次最多的几个医患问答平台依次编写相应的爬虫规则,爬取当前已经记录的疾病、病症以及医患问答记录,并对数据进行结构化处理。其次,使用双向长短时记忆网络和条件随机场算法,对每个问答记录进行命名实体识别,提取出每个问答的疾病和症状的相关信息,并构建相应的“疾病-症状”网络。然后,本文针对实际数据的特点提出一个更能表现单节点预测正确率的N点连接精确度指标,并在已有的链路预测算法上进行改进,提出NIS算法来进行疾病之间连边的预测和症状之间连边的预测。同时,本文分析了医患平台上疾病频次的分布以及症状在每个疾病中的分布,提出了两种权重矩阵的计算方法来进行疾病的预测。最后,使用SSM框架来搭建该系统,在系统中集成了命名实体识别算法、链路预测算法以及疾病预测算法。系统的前端开发,使用AJAX异步传输所有信息,提升用户使用系统的流畅度。为了提高系统的可维护性,在开发该系统时候,采用前后端分离,前后端的交互利用JSON格式传输数据。同时对外提供了API接口,方便其他开发人员使用本系统的方法和结果。