基于传统规则的中医知识智能问答系统研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:soiney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:近年来,智能问答系统的研究热度急剧飙升。区别于传统搜索引擎,智能问答系统提供的信息服务速度更快、准确率更高。对基于中医的智能问答系统进行研究,可以为受限领域的问答研究提供经验。将中医知识智能问答系统划分为三部分,分别是问句的分析理解,信息检索和答案返回,并使用基于传统规则的方式完成智能问答过程。实验结果表明,系统可以对13类问题进行针对性的回答。
  关键词:中医;智能问答;知识库;传统规则;受限领域
  中图分类号:TP391 文献标识码:A
  文章编号:1009-3044(2019)32-0200-02
  1概述
  人类日常生产生活过程中充斥着各种各样的信息,如何从众多信息中獲取到有效的信息是值得关注的问题。随着信息化时代的到来,人们获取信息的方式由传统的书籍、信件等发展成了现如今的网络化信息获取。网络化信息获取主要媒介就是传统的搜索引擎。用户通过输入一些关键词,搜索引擎会返回许多与之相干的页面,而这些网页内容的质量参差不齐,因此用户必须根据实际需要对信息进行筛选,无形中消耗了更多的时间,这无疑与现如今快节奏的生活背道而驰。
  顺应社会发展要求,问答系统应运而生。用户输入自然语言问题后,问答系统接收并对问题进行分析理解,直接返回问题的正确答案,这个过程很好弥补了传统搜索引擎的缺陷。华盛顿大学图灵中心主任Etzioni教授曾指出,问答系统具有的高效、准确的特点,必将引领下一代搜索引擎的发展形态。而且近些年来,知识库技术的发展为问答系统提供了新的突破性进展。
  中医作为传统文化的瑰宝,在中华民族发展过程中积累了大量的临床经验。将基于知识库的问答系统应用于中医学领域,对于提高人们获取医学知识的效率、淋漓尽致地发挥中医应用价值有着重要意义。
  2中医知识库的构建
  知识库,又称知识图谱。利用节点和有向边两种基本元素对知识进行组织。其中,节点代表现实世界中客观存在的实体,而边则表示实体间存在的关系。对中医知识智能问答系统进行研究,首当其冲的,要构建一个基于中医知识的知识库。
  首先,知识获取阶段主要是从半结构化的中医网站中利用爬虫技术爬取相关的中医知识数据,作为构成知识库的数据来源。并且由于这些初步数据不可避免地存在数据不干净、表达不规范等问题,需要人工进一步进行分析处理,剔除掉不可用的无效信息。其次,知识表示与存储阶段采用图结构对中医知识进行组织,并采用Neo4i图数据库作为数据存储工具存储中医知识数据。
  3智能问答过程
  一般来说,智能问答系统主要由问题分析与理解、信息检索和答案返回三部分组成。其中:
  问句分析理解是第一步骤,也是先决环节,其分析理解的精度将直接影响后续步骤的执行。
  信息检索旨在知识库中确定问句实体位置,缩小问题答案范围。
  答案返回则是将查询结果套上各种类型问题的回答模板返回给用户,以免直接返回答案太过于晦涩。如果用户的问题表达缺乏必要的信息,会根据缺失内容进一步引导用户输人正确的问句。
  以问句“患失眠后可能有哪些表现?”为例,分析问答过程:
  首先,问句分析理解阶段主要进行实体识别、问句分类等操作。利用实体识别技术抽取出用户输入问句中所包含的实体关键词,并获取实体关键词所对应的实体类型。通过穷举各种可能提问问题的方式,建立不同类型关系类型的疑问特征词集合。通过实体类型辅以问句的疑问特征词匹配,共同确定问句所询问的关系类型,对问句的操作类型进行分类。以“症状”特征词集合[“症状”,“表现”,“症候”,“表征”]为例。通过对问句进行分析理解,获取的实体为“失眠”这类中医疾病实体,辅以“症状”特征词集合中的元素“症状”,因此可以确定问句的操作类型是要询问“疾病的症状”。
  信息检索将问句分析理解的结果,即不同的问句操作类型,转化为Neo4j数据库支持的cypher查询请求,作为问题和中医知识库连接的媒介,从而支持问答服务。利用Neo4j的cv-Dher语句直接match到知识库中相应的节点和关系边。所举例子中,在知识库中由“失眠”的节点出发,经由“症状”关系边,所到达的节点即为失眠的症状节点,也就是问题的答案。当与知识库数据进行交互时,如果表达数据不精确,则使用模糊匹配,提高问题处理的灵活度。
  答案返回则是获得cypher语句的操作结果并辅以各种类型问题的回答模板返回给用户,至此完成全部的问答服务。所举例子的操作类型为询问“疾病的症状”,封装上该类型回答模板后,返回结果为“失眠的症状有:不寐,心烦,头重目眩等”。
  实验结果表明,系统可针对13种不同类型的问题给出针对性的回答。
  4结论
  中医作为中国的传统医学文化,蕴含了丰富的病理知识。近些年来,国家颁布诸多法令促进中医学的发展。响应国家号召,对中医知识的智能问答系统进行研究,对于促进中医学“现代化”具有重要意义嘲。使用基于传统规则的方式对中医领域的智能问答系统进行研究,回答结果依赖于规则制定的覆盖范围。相信利用数据挖掘技术,采集更多的问句样本,可以提高规则的覆盖范围,扩大问题回答的广度。
其他文献
摘要:《MSOffice高级应用》是一门技术性和应用性都很强的课程。通过将计算思维中的程序思维和算法思维融入《MsOf-rice高级应用》课程的教学实践表明,计算思维可以激发学生的学习兴趣、提高学习效率、培养学生良好的计算思维能力。  關键词:计算思维;MSOffice高级应用;应用研究  中图分类号:G642 文献标识码:A  文章编号:1009-3044(2019)32-0180-01  1概
摘要:随着我国新时期学生教育改革工作的推进,人们对于学生教学工作实施要求越来越高。尤其是在计算机网络技术课程教学中,更是对学生教学工作实施提出了新的要求。以混合式多种教学法应用,可以满足计算机网络技术课程教学工作实施需求,改善了原有计算机网络结束专业教学方式,提升了计算机网络技术课程教学质量。因而该文在研究中,以基于混合式多种教学法在计算机网络技术课程中应用研究为主进行了相关探讨,主要阐述了混合式
摘要:随着现代社会的迅速发展,越来越多的人开始关注针对计算机的系统教学,科技的发展速度有时远超人们的想象,所以为了建设现代化社会,学校也需要跟上时代的脚步,对于中专的计算机教学加以改进,加入现代化先进思想,以学生们为学习主体,鼓励自主学习模式。本文从实际出发,对目前中专计算机教学方式加以分析,探究优化对策,为计算机自主学习的进一步实施上的优化奠定一个良好的基础。  关键词:计算机教学;自主学习;优
摘要:随着我国计算机技术的迅猛发展和逐步推广,市场上对于计算机的技术型人才的需求也在逐步增大,技工院校的计算机专业的学生在就业方面仍然会因为不能专业对口而出现被拒收的现象。我们分析这个原因,还是因为教学内容和技术落后导致的。计算机技术的第二课堂是对第一课堂的继续补充和不断完善。各个院校都应该尝试通过第二课堂的方式,能够及时地为学生传递新颖的技术观念和培训内容,但是获取的教学成果却不是令人满意的。我
摘要:编程语言和编程活动的简易化,以及数字化产品使用低龄化使低龄儿童编程教育应运而生。ScratchJr作为一款面向低龄儿童的平板应用编程APP,在培养低龄儿童的计算思维和促进幼儿STEAM教育实施等方面有重要意义。鉴于此,探究以ScratchJr为载体开展面向低龄儿童的编程启蒙教育,从而促进低龄儿童情感、语言、社会性、数理逻辑以及创造力和想象力的发展,并期待为我国低龄儿童编程启蒙教育的发展提供参
该文提出"做学教合一"教学模式是对传统教学模式"教学做合一"的改良,分析"做学教合一"教学模式在FLASH动画制作课堂教学中的实践,从而总结出"做学教合一"教学模式是符合当前职业教育的特点,大大提高课堂教学效率和学习效果。
随着二维码技术在高校档案管理中的应用,教学档案管理也需要采用新的二维码技术来创新管理模式,以便于为用户提供个性化的体验服务。通过对二维码在高校教学档案管理中的优势进行分析,讨论了二维码技术在高校教学档案管理中的实现途径,并提出了二维码技术在高校档案资源管理中的实施策略。
摘要:随着VR旅游产品开发技术的进步以及消费者在视觉追求上的提升,在新一代的旅游产品设计开发时不能只追求旅游产品的模拟仿真,还应追求良好的交互性,强烈的沉浸感与完美的视觉效果。因此在前期三维模型设计与实景场景开发的基础上,后期可以通过AE进行标题与LOGO动态设计、交互uI界面设计、调色处理、背景音乐及音效处理等,使VR旅游产品展出现更强的视觉冲击力与更智慧、更贴心的服务。该文以仙都4A风景旅游V
尿沉渣检查是对尿液进行有形成分识别的重要检查手段,可以及时有效地检查出肾脏疾病和泌尿道疾病,尿沉渣图像检查的临床诊断准确度以及检测速率的快慢,成了现阶段在医学研究上的重要讨论话题,尿沉渣显微图像中有形成分繁多,所以在进行有形成分的识别时需要进行相应的图像处理,才能够分析出显微图像中各成分的占比,并做出准确的临床诊断。该文首先分析了尿沉渣显微图像的特点,并展开了关于尿沉渣显微图像有形成分聚类分析识别