论文部分内容阅读
当下传统的信息检索不能充分理解问题的语义,给出的查询结果往往形似而神不似,且是杂乱的知识需要人为筛选。尤其是进行医疗咨询,医学知识的复杂性和严谨性使得获取该领域相关问题准确而简洁的答案成为了研究者值得关注并具有发展前景的研究方向。此外,随着信息化技术在医疗领域的广泛运用,人们在互联网上搜索相关问题的频率也越来越高。在医疗领域,亟待一个诸如“家庭医生”的能解决基本医疗问题的咨询问答信息系统给予医学帮助。一方面自动问答研究的目标就是针对问题给出问题准确、简洁的答案;另一方面本体具有良好的知识组织管理能力,可以理解知识的语义进行语义层面的推理。因此本文以医疗领域本体为例,提出一种基于本体的具有语义推理的自动问答模型,力求运用本体在知识管理和推理上的优势,实现廉价、高效、精准的医疗答疑和诊断建议等医疗服务。主要工作如下:(1)分析整合医疗领域医学数据,给出抽取医疗领域知识的方法,构建了一个医疗领域本体。并在该医疗本体的基础上,分析了如何运用本体模型实现自动问答的过程。(2)针对基于框架理解问题语义面临的静态框架无法自动更新的不足,提出了一种在CFN框架上运用领域本体自动生成QFN问题语义解析框架来解析问题结构的模型,从而为问句理解提供了一种新的理解策略。并在理解问题的基础上将传统的由问题生成本体SPARQL查询语句的Seq2seq方式转化为分类问题来实现,提出基于RDF三元组查询图和基于深度学习结合的本体查询语句生成算法,从而避免了Seq2seq模型复杂带来的网络参数及结构自适应调整和训练语料量大的挑战。(3)设计实验,构建医疗领域自动问答实验系统验证和评估方法的有效性。实验表明基于本体的医疗领域自动问答系统能提高问句回答的准确性和简洁性,在问题语义推理方面具有较好的性能,具有很好的应用推广价值。