基于特定领域知识图谱的智能问答新系统

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:jiangtianyu1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业的快速发展,传统的搜索引擎仅仅基于关键字进行匹配,忽略了用户的语义意图,难以准确的返回有效信息,已经无法满足人们快速搜索的需求。问答系统能够利用神经网络理解用户输入的文字中隐含的语义与意图,准确的给出用户想要的内容。问答系统分为任务型问答系统与非任务型问答系统。非任务型问答系统主要基于开放域知识完成与用户的闲聊功能。而任务型问答系统则是基于特定的领域知识完成用户给出的任务、回答用户问题的功能,广泛应用于客服领域、专业领域。知识图谱是一种结构化表示知识的技术,相比传统的关系型数据库,能够更好的存储领域相关知识,极大的提高用户对知识的检索效率。因此,基于知识图谱的任务型问答系统具有更广阔的前景。本文以医疗领域为例,研究并实现通过爬取半结构化数据快速创建特定领域知识图谱的方法。通过爬取Web网页数据,得到半结构化数据,对半结构化数据进行数据清洗、实体识别与关系提取,并永久存储于图数据库中。研究当前主流意图识别、对话管理技术与开源框架,研究并实现通过Rasa框架搭建意图识别服务、对话管理服务,从意图识别准确度、问答准确度对Bert模型与Mitie模型进行评价。并根据医疗领域业务逻辑,设计训练数据、对话模型,设计动作函数,以槽填充的方式实现多轮对话管理。为保证系统功能的完整性,该系统通过会话管理服务完成对用户请求的处理,通过账户管理模块记录用户的病历与问答历史,并通过Docker以微服务形式将会话管理模块、对话管理模块、账户管理模块进行分布式部署。为保证系统性能,通过Nginx实现系统负载均衡,并通过改进的负载均衡算法维护用户问答过程的专注度。
其他文献
流化床反应器具有反应效率高,燃料适用性广和环保性能好等优点,其已成为工业反应的主流,并在工业生产中占有重要地位。本文的研究对象是一种新型的四流化床气化系统,其结合了双流化床气化和化学链空气分离技术,能在实现高效气化的同时降低碳排放量。然而,关于此系统的研究还停留在理论分析层面,因此下一步重点是对该系统的气固流动特性和内部耦合影响机制进行研究。为了探究四流化床系统的特性,本文采用冷态实验的办法,为此
本研究以“形式聚焦”、“输出假说”和“注意假说”为理论框架,探究四种不同的读写组合模式对高中学生英语词块习得的影响程度。本研究试图回答以下两个问题:(1)四种干预手段对高中学生目标词块习得的即时效果分别是什么?(2)四种干预手段对高中学生目标词块习得的延时保持效果分别是什么?研究对象是江苏省南京市某高中高一的四个平行班共124名学生。每个班接受读写结合的不同干预方式,分为四个组:阅读-写作组(R-
近年随着计算机科学的快速发展,态势感知技术取得了显著进步,主要体现在出现了许多以机器学习技术为基础的态势感知模型。但随着人因工程、认知科学的重新兴起以及人们深度学习、大数据等技术的反思。这些模型通常忽略了对被试的心理模型、认知过程等主观因素。将主观量表数据与客观传感器数据进行融合、建模和测量,对态势感知模型的研究具有重要意义。本文对态势感知测量技术、态势感知相关理论模型以及态势感知技术的应用进行了
随着大数据时代的到来,多模态数据越来越多,人们对多个模态间数据检索的需求也越来越大,跨模态哈希是一种有效的跨媒体检索方法。大多数现有跨模态哈希方法都是基于批处理学习模式学习哈希函数,这种模式不能有效处理大规模数据集,内存消耗大,并且训练流数据效率低。在线跨模态哈希可以通过在线学习哈希模型来解决上述问题。然而现有的在线跨模态哈希方法虽然可以在线更新哈希模型,但是不能通过新学习的模型更新旧数据的哈希码
学位
由于我国能源资源储量的特点,煤炭在我国能源结构中占有很大的比重。在煤炭的开采过程中,瓦斯事故的发生始终威胁着煤矿工作人员的生命安全,也造成煤炭企业的经济损失。瓦斯涌出量能够体现出煤层中瓦斯的赋存情况,是设计矿井通风系统的重要指标。同时,煤炭企业中瓦斯爆炸、煤与瓦斯突出等事故的发生与瓦斯涌出异常密切相关。因此,准确快速的预测瓦斯涌出量数据对煤矿工作人员、企业、政府有十分重要的意义。在实际煤炭开采中,
当前在全球经济多元化发展的现实之下,股权项目投资已经进入迭代升级的阶段,对世界金融市场影响巨大。特别是近些年来,我国的股权项目投资也经历了快速发展的过程,但是其发展历程短、速度快,存在很多弊端,比如在资金募集、项目抉择、跟踪管控和盈利退出方面还存在一些问题和短板,亟待有针对性的改善。基于以上,为深入剖析我国股权项目投资在各个环节中存在的不确定风险,及时有效的建立针对性的预防和应对机制尤为关键。鉴于
FBMC技术因为较高的频谱利用率,带外衰减低等优点,受到越来越广泛的关注。而其与多输入多输出技术(MIMO)技术相结合的MIMO-FBMC系统,更是能增加整个系统的吞吐量,提高无线通信的传输速度,被认为是未来移动通信系统的备选方案之一。所以本文针对MIMO-FBMC系统的信道估计和均衡等关键技术展开研究。本章首先阐述FBMC系统的基本原理,分析了系统存在固有干扰的问题。并搭建了SISO和MIMO仿
学位
近年来,由于财政非税收入的管理存在征收数额大、主体多元化等特点,导致财政非税资金长时间内处于管理不规范、财政专户滞留时间长、入库速度慢的现状。同时随着现代支付方式的改变,移动支付正在迅速占领支付市场份额,为了适应市场经济的要求,迎合缴费人多样化缴费方式的需求,加强对非税收入的规范化管理,建立合理的非税收入秩序,有效整顿和规范财政非税收入资金的入库流程,提高非税参与者的满意度,通过信息化手段更新优化