【摘 要】
:
现如今,随着各行各业信息化建设的加快和产业规模的扩大,人们为了更加精准高效地获取更多的前沿信息以开拓视野增加认知,都会使用智能问答系统进行查询。智能问答系统是一种基于人工智能的、比传统搜索引擎更为强大和高效的信息检索系统,也是用户使用自然语言和计算机交互的一种重要形式。一个良好的智能问答系统需要丰富的底层语料库参与以便能提供推理决策支持,所以如何从语料库中组织出决策所需的相关信息以帮助系统更好的完
论文部分内容阅读
现如今,随着各行各业信息化建设的加快和产业规模的扩大,人们为了更加精准高效地获取更多的前沿信息以开拓视野增加认知,都会使用智能问答系统进行查询。智能问答系统是一种基于人工智能的、比传统搜索引擎更为强大和高效的信息检索系统,也是用户使用自然语言和计算机交互的一种重要形式。一个良好的智能问答系统需要丰富的底层语料库参与以便能提供推理决策支持,所以如何从语料库中组织出决策所需的相关信息以帮助系统更好的完成推理过程就格外的重要。这里涉及到两个难点:如何根据语料库内在特征和结构提炼出富语义的实体连接关系数据,以及如何根据这些数据进行智能高效的推理以回答用户的提问。因此,能够从底层语料库中自动构建出与用户问题相关的实体关系数据,并通过智能高效的推理方法从中获得解答就变得很有研究价值。本论文将以中文维基百科为基础语料库,进行基于自然语言实体连接关系的智能问答推理方法关键技术的研究,并期望未来推广到一些特定领域的语料库上也能实现相应的效果。研究工作主要包括设计中文的实体提取算法,从问题描述语句中导出关键实体信息,并利用语料库构建出自然语言实体连接关系,以完成推理决策数据的构建,最后结合BERT预训练语言模型和图神经网络架构来设计出高效的智能问答推理算法。实验表明整个系统具有较强的推理分析能力,并能根据用户复杂的问句文本给出合理正确的答案。本文还以此为基础开发了一套可用的智能问答系统交互界面,它具有良好的交互能力和用户体验。
其他文献
本文基于企业环境规制的微观识别,分析了环境规制对企业技术引进和自主创新两种技术进步方式的影响。研究发现:受到强制性环境规制后,企业技术进步路径会偏向技术引进;从异质性分析看,当受到环境规制时,东部地区企业会偏向技术引进,而中西部地区企业不仅不会增加技术引进,还会降低自主创新,以消极方式应对环境规制;从机制分析看,技术引进能够更好地改善企业环境绩效,稳定其生产规模,但对于企业生产率提升作用不明显;进
随着全球定位技术和基于位置服务的发展,大量文本数据附带了空间位置信息。在地理数据和文本数据的融合变的愈加普遍的情况下,空间文本数据的相关研究成为时空数据挖掘研究领域的热点之一。然而,数据的使用价值随着时间递减,及时获取到的有重要价值的信息对用户的决策有重要的影响,因此越来越多的研究人员开始研究空间文本数据的实时处理算法。空间文本数据的连续查询为本文的主要研究内容。不同于传统的查询,连续查询从注册于
大数据的一个重要特征是多模态,不同行业领域的数据来源广泛、形式多样,每一种来源或形式都可以看作是一种模态,例如视频、图片、语音等。基于这些多模态数据,用户可能选择任何媒体形式的内容作为查询条件,因此跨模态数据之间的信息检索具有非常广阔的应用空间,已经成为目前研究的一个热点问题。跨模态检索的主要挑战是如何弥补不同模态间的语义鸿沟,目前已有的基于深度学习的跨模态检索方法通常利用神经网络单独学习每个模态
强化知识产权保护是新发展格局下中国实现贸易竞争力提质升级的重要举措。本文将知识产权保护与全球生产分工纳入异质性企业框架,从成本节约效应和价值链提升效应揭示出技术后发国家增强知识产权保护提升企业出口国内增加值率的影响机制,以及技术距离的调节效应。然后,本文运用2000—2013年中国工业企业数据库和中国海关贸易数据库匹配数据进行实证检验,发现强化知识产权保护将显著提高企业出口国内增加值率,其作用机理
随着深度学习的发展和各种终端设备算力的提高,人脸识别被广泛的应用在生活的各个领域,人脸检测和跟踪是其中重要的一环。在实际环境中,人脸检测和跟踪处理图像的质量受到多个因素影响,如不同的摄像头对成像的处理、环境光的明暗变化、人脸面部遮挡物和面部姿态等。这些因素会导致在数据集上运行良好的算法在实际应用效果不佳。针对实际应用中人脸检测跟踪需求,设计并实现了面向复杂环境下的轻量级人脸检测跟踪系统。首先建立数
轨迹数据是对移动对象的运动过程进行采样所获得的地理信息序列。随着GPS设备的普及,轨迹数据规模呈爆发式增长,这使得可以通过分析轨迹数据来方便人们的生活。基于轨迹相似度的k最近邻查询是轨迹数据分析的基本运算之一。然而,海量的轨迹数据使得现有的单机算法无法高效地完成查询任务。分布式方案能够利用多台机器的资源去加速查询过程,但目前最先进的分布式方案存在计算资源浪费和局部索引查询效率低的问题。为了解决上述
最短路径问题是路网中一个基本的计算问题,在GPS导航、POI推荐以及路径规划等服务中有着广泛的应用。Dijkstra算法是解决最短路径问题的常用计算算法。给定查询起点和终点,它按照到点距离的远近顺序依次访问其他节点,并在到达终点时终止搜索。该算法简单精确,但是具有很高的复杂度,无法应用于路网这种大规模网络。因此,研究人员们采用基于索引的方法来解决在线搜索开销大的问题,而标签索引表现出了绝对的优势,
深度卷积神经网络的出现使人工智能得以迅速发展,使得人工智能在许多领域发挥出举足轻重的作用,如智能家居、智慧医疗和智能交通等。智能化水平的提升不可避免的要求深度卷积神经网络更加复杂,以应对复杂的应用场景。然而硬件的发展遇到瓶颈,硬件资源提升的速度已无法跟上模型复杂度的增长速度,模型越来越难训练,使得人工智能的入行门槛也越来越高。物联网中的移动终端中存在着丰富的空闲硬件资源,如何利用它们成为了人工智能
在信息技术的高速发展的现代社会,海量的数据常结构化存储于数据库中,在检索数据时,需要用到统一数据库查询语言SQL。但SQL作为有严格语法规则约束的结构化查询语言,需要用户具备数据库和SQL专业知识,使用门槛较高,对非专业用户不友好。近年来,为了提高数据库的信息检索效率、降低用户的使用门槛,使数据库能更好服务于大众,由计算机将自然语言问题直接生成为SQL语句的研究得到了人们的关注,该研究任务被称为T
伴随企业数字化转型与经济数字化发展,交易型数据库管理系统以其高实时响应性能与事务处理安全可靠特性,已越来越成为国计民生行业中数据基础设施的重要组成部分。其运行时若出现不稳定表现或突发崩溃对企业或民生基础设施将产生巨大损失与严重后果。针对此问题,设计实现了一套测试工具,能对交易型数据库的运行时稳定性性能进行测试。测试工具着重增强了干扰场景。针对数据库运行时会受同服务器服务进程物理硬件资源占用的干扰,