论文部分内容阅读
随着互联网技术以及其产品的发展,在线问诊已成为一种新的问诊方式逐渐融入人们的生活。通过网络健康咨询平台,人们通过向在线医生提交自身病症信息,可以方便的获得免费的诊断、医疗知识以及医生的建议等帮助。然而在线健康咨询平台也面临在线医生资源缺乏、平台咨询程序繁琐、在线应答结果质量等问题。论文基于文本信息抽取技术,针对心理健康问题,重点研究如何从在线用户提交的有关精神心理问题的表述文本中,抽取关键的、有效的病症信息,并通过构建文本病症信息抽取子系统,从而进一步实现在线智能诊断。针对患者自述文本的病症信息抽取,论文主要从以下几个方面做重点研究。首先,显式病症实体抽取。通过对患者自述文本分析发现,在线文本中不仅存在简单的病症信息,还包括患者的性别、年龄以及病症持续时间等一般实体信息,论文将这类信息归为显式病症实体信息。论文提出一种基于条件随机场模型的网络患者自述文本显式病症实体的抽取方法,该方法在解决自述文本中实体特征距离跨度大的问题效果较好。在实验中,该方法取得综合指标80.54%的较好成绩。其次,隐式病症实体抽取。在患者自述文本中,含有因患者描述不专业而导致的且需要推导的隐式病症信息。针对这类病症信息,论文提出基于语句向量相似度计算的抽取方法,该方法从向量相似度计算的角度,实现文本中语句的分类,并根据分类结果获得语句中所含的隐式病症信息。在开放实验中,该方法取得综合指标71.27%较为满意的成绩。最后,论文主要依据以上理论研究,从工程的角度,完成论文研究所依托的在线诊断系统平台中病症信息抽取子系统的设计与实现,并对系统初期形态有一个简单直观的展示。