【摘 要】
:
随着互联网的飞速发展,信息呈现爆发式增长,从海量信息中获取用户所需信息的智能问答系统也应运而生。不同于搜索引擎那样需要用户自己搜索并整合相关信息得到问题的答案,用户通过问答系统提出问题便可得到简单准确的回答,能够满足用户快速获取问题答案的需求。问答系统在实践中有着广泛应用,特别是限定领域的问答系统,在实际社会生产中能够为用户快速提供该领域专业且准确的回答。早期的问答系统大多基于规则模型和统计模型实
论文部分内容阅读
随着互联网的飞速发展,信息呈现爆发式增长,从海量信息中获取用户所需信息的智能问答系统也应运而生。不同于搜索引擎那样需要用户自己搜索并整合相关信息得到问题的答案,用户通过问答系统提出问题便可得到简单准确的回答,能够满足用户快速获取问题答案的需求。问答系统在实践中有着广泛应用,特别是限定领域的问答系统,在实际社会生产中能够为用户快速提供该领域专业且准确的回答。早期的问答系统大多基于规则模型和统计模型实现,并不能很好的理解用户提出的自然语言问题。随着技术的发展,出现了机器学习领域的重要分支——深度学习,使用神经网络作为特征提取器,将人们从传统机器学习繁重的特征工程中解放。深度学习在问答系统领域取得了很好的效果,目前性能较好的智能问答系统大都基于深度学习实现。本文面向保险领域构建基于深度学习的问答系统,旨在为用户提供一个专业且高效准确的保险问答系统。系统包含保险问答数据集构建、候选问答对检索和答案生成三个模块。保险问答数据构建模块负责数据集的收集、扩展和问答对索引库的构建。候选问答对检索模块负责对用户提出的问题进行理解并从构建好的问答对索引库中基于Lucene快速检索出候选问答对集。答案生成模块负责答案的生成,通过BERT模型对候选问答对集进一步筛选获得更小规模的高质量候选答案集,使用BertSum模型对候选答案集进行文本摘要生成最终答案。系统实现采用三层架构设计,前端使用Thymeleaf模板和Bootstrap框架构建,负责用户交互、向后端发送请求并展示返回的数据。后端分为Java中台和Python后台,Java中台使用SpringBoot框架和Mybatis框架实现,负责前端和后端的信息交互、索引库的构建以及数据持久化;Python后台负责深度学习相关代码实现。使用gRPC进行中台和后台的跨语言通信。使用MySQL数据库存储系统数据。
其他文献
主题模型及其相关方法,通常被用于学习语料库中一系列隐含的主题,以及预测隶属于每个主题的每个文档中每个单词的概率。因此,主题模型是用于学习文本的隐含表示的最主流的方法之一。而基于贝叶斯理论的概率主题模型则是其中最经典的代表。概率主题模型有很连贯的理论证明以及很强的可解释性,适用于长文本。但是现有的大部分概率主题模型都有一个关键性的弱点,就是需要大量的文档数据,进而依赖大量的统计数据来生成可靠的主题。
舞蹈是一种蕴含丰富人文内涵、美学价值的艺术形式,舞者的生理条件和乐感越出众、对编舞的理解越准确,其呈现出的舞蹈通常越专业。随着三维建模技术的发展,以动作捕捉设备为主要工具的舞蹈数字化技术,在数字电影和动画制作领域发挥着重要作用。然而,舞蹈的专业性对舞者的形体动作具有严苛要求,使得动捕过程中的重复采集现象频繁出现,导致专业舞蹈序列的获取成本十分高昂。因此,如何利用智能处理方法提升数字舞蹈序列的专业性
现场可编程门阵列(Field Programmable Gate Array,FPGA)被广泛应用于航空航天、高性能计算、5G通信等领域,具有开发周期短、易升级维护、现场可编程等独特优势,但其硬件安全问题也逐渐显现。硬件木马(Hardware Trojan,HT)攻击近年来已成为FPGA的一大安全威胁,国内外许多机构和学者将机器学习算法与FPGA安全检测相结合,收到了较好的效果。但是,这些研究大多
图被广泛应用于各种领域的关系建模,比如社会学、生物信息学、基础设施、万维网等。现实生活中的图通常是全局稀疏,但局部紧密,也就是平均度数往往相当小。因此,如何在一个大规模的图网络中挖掘出这些紧密子图是一个非常热门的研究课题,它可以帮助人们找到图中的关键节点或者群体。目前的研究中已经给出了很多的紧密子图模型,比如k-core、k-truss、clique等,但这些都只是考虑图的拓扑结构。而真实的网络图
随着智能设备的普及,群智感知逐渐成为一种普适感知新范式。群智感知基于众包理念,其充分利用大量拥有智能设备、具备感知能力的个体,实现海量异构数据的采集,解决大规模数据需求问题。与传统的传感器网络相比,群智感知系统不需要大量部署专门的传感器设备即可获取海量感知数据,大大降低了数据获取的成本。目前,群智感知已经被广泛的应用在对现实物理世界的感知中(如交通信息采集、空气质量监测、城市WiFi勘测等)。尽管
随着计算机视觉方向的研究日渐深入,社会安全对计算机视觉技术的需求不断增长,智能安防成为城市安全防护的重要手段。传统的人脸识别虽然可以通过人脸信息来定位人的身份,但是却无法在模糊的监控影像中对整个人体起作用。行人重识别正是解决此难点关键的研究方向之一,这种技术被用来对画面中的行人进行再识别,以确定每个人的身份信息。行人重识别是一项具有挑战性的图像检索问题。由于实际场景复杂多变,行人的前景和背景无法被
植物能够通过改变各种功能性状和资源分配模式,产生多种应对不同胁迫或干扰环境的生态策略。植物生态策略研究对于解答植被演替、生物多样性保护、生态系统功能维持及全球环境变化响应等生态学前沿热点问题具有重要意义,但现有研究多聚焦于植物种间水平的宏观分析,对植物生态策略的遗传与环境驱动机制的了解相对较少,特别是缺乏对种内遗传谱系分化作用的研究,限制了生态策略的机理探究与应用推广。本研究通过将野外调查和多年同
计算机辅助设计(Computer Aided Design,CAD)广泛应用于我国诸多行业中。目前我国的CAD几何引擎技术落后于国外,CAD市场更是处于被国外垄断的状态。为了摆脱该现状,我国需要早日开发出完全由中国自主研发的CAD几何引擎并广泛投入使用。为了开发出中国自主研发的CAD几何引擎,我国早已将对产品数据模型表达与交换标准(Standard Exchange of Product data
参数曲线和曲面是计算机辅助设计应用的重要出发点,通常情况下,渲染、求交以及裁剪曲线和曲面等相关应用的算法是基于它们的参数化而不是固有的几何形状。曲面可以有许多不同的参数化形式,根据实际的应用选择合适的参数化对曲面进行重新参数化往往能得到较为理想的结果。应用结果会受到曲面参数化质量的影响,比如在曲面离散、曲面求交、曲面纹理映射、曲面渲染、曲面配准等应用中,曲面参数的一些诸如正交性等性质能够带来更加稳
随着国内物流行业的发展,商用车数量持续上涨,运输危化品、易燃易爆特征材料的商用车需要确保运输过程的安全性,运输普通货物的商用车需要确保货物能够及时到达目的地,因此故障预警变得至关重要。故障预警可以提前预知设备未来的运行状况并及时反馈,提示操作人员设备已出现故障征兆,有助于操作人员及时采取预防性维护或维修,使设备始终处于良好的运行状态,避免因故障造成的严重灾难,减少因故障带来的严重损失。目前的故障预