【摘 要】
:
随着人工智能的迅速发展,以大数据知识工程、自然语言处理和深度神经网络等为基础的新型信息技术受到了国内外多个行业领域的密切关注,知识图谱作为大数据知识工程的核心技术得到广泛应用,其下游任务知识图谱问答也已在多个行业领域进行了有益探索。目前,桥梁工程领域信息化建设正处于起步阶段,桥梁管理养护过程中也已积累了大规模的桥梁检测数据,为桥梁管养的数字化发展奠定了数据基础。结合知识图谱和智能问答关键技术,开展
论文部分内容阅读
随着人工智能的迅速发展,以大数据知识工程、自然语言处理和深度神经网络等为基础的新型信息技术受到了国内外多个行业领域的密切关注,知识图谱作为大数据知识工程的核心技术得到广泛应用,其下游任务知识图谱问答也已在多个行业领域进行了有益探索。目前,桥梁工程领域信息化建设正处于起步阶段,桥梁管理养护过程中也已积累了大规模的桥梁检测数据,为桥梁管养的数字化发展奠定了数据基础。结合知识图谱和智能问答关键技术,开展桥梁检测领域知识图谱构建和知识图谱问答研究,对辅助桥梁管理养护,加速桥梁工程信息化建设具有重要意义和深远影响。因此,针对桥梁管养实际业务场景中的交互式细粒度知识问答服务不足问题,本文开展了桥梁检测领域知识图谱问答关键技术研究。(1)针对桥梁检测领域知识图谱和问答语料缺乏问题,提出了一种适应该领域特性的知识图谱及问答语料构建方法技术路线。首先,采用OWL本体语言对该领域概念、属性及公理约束进行了形式化语义建模。然后,采用多任务联合学习模型对细粒度信息进行抽取,并将融合后的实例数据存储在Neo4j图数据库中,实现知识图谱化表示。在此基础上,选择了该领域知识图谱中154座桥梁的25103个相关知识三元组,构建了一个包含桥梁基本信息、损伤病害、技术状况等问题类型的桥梁检测知识图谱问答语料库,初步满足了桥梁检测知识图谱问答任务的实验数据需求。所提联合学习模型在桥梁检测领域命名实体识别、关系抽取任务中的F1值分别为93.28%、74.00%。(2)面向桥梁检测这一限定问题域场景下的实际问答需求,提出了一种基于问题分类的模板匹配式桥梁检测知识图谱问答方法。该方法选用BERT模型进行字符级嵌入,采用朴素贝叶斯分类算法进行问题分类。根据抽取到的主题实体对问题分类后所匹配到的问题模板进行实例化,并生成相对应的Cypher结构化查询。最终以自然语言短文本形式返回问题答案,实现桥梁检测领域细粒度结构化信息的交互式问答。实验结果表明,基于问题分类的模板匹配式知识图谱问答方法能够较好地回答细粒度桥梁检测问题,问题模板匹配的精确率、召回率和F1值分别为87.16%、76.70%和81.60%。(3)针对桥梁检测问句向量化表征与知识三元组嵌入的语义相似度计算问题,提出了一种融合BERT和层级交叉注意力机制的桥梁检测知识图谱问答模型。首先,BERT预训练语言模型和静态领域词典用作桥梁检测问答对的嵌入层,以提取多粒度特征。其次,使用Bi LSTM神经网络深度提取问题的上下文特征以找到主题实体。最后,层级交叉注意力机制实现了桥梁检测问句和知识三元组之间的信息交互,并从浅层词汇和深层语义两个维度计算问题和候选答案间的语义相似度。所提模型在NLPCC问答数据集和桥梁检测问答语料上都取得了优异的性能,其0)(62)0)1值分别为84.25%、86.95%。综上所述,以桥梁智能化管养为问题导向,结合知识图谱与智能问答技术,构建了桥梁检测领域知识图谱和问答语料。以此作为数据支撑,分别提出了适应于桥梁检测领域的模板匹配式知识图谱问答方法和信息检索式知识图谱问答模型。同时解决了桥梁检测问句的结构化查询转化问题以及问答对语义相似度计算问题,达到了预期目标。
其他文献
随着城市化进程的加快,城市人口规模的增加和私家车保有量的增长导致城市交通拥堵问题愈发严重。提升公共交通乘坐体验,吸引更多人优先选择公交出行是缓解城市交通压力的有效方法。为乘客提供准确的公交车运行时间信息是提升公交出行吸引力的重要举措之一,因此,本文针对公交车运行时间预测方法进行了一系列深入的研究。主要研究内容如下:(1)本文介绍了公交车GPS数据的基本信息,结合车辆运行速度分析了公交车运行特性,并
针对物理教学中实践性作业存在的问题,论证了建立实践性作业评价标准的必要性,提出核心素养导向下的实践性作业评价标准的框架,选取初中物理八年级实践性作业实例,提供物理实践性作业评价标准样例,以期对物理教学实践性作业的有效实施起到促进作用。
互联网和移动互联网的高速发展为人们带来了包括文本数据在内的海量信息,然而如何有效掌握其中的关键信息却实为学界和工业界的一个重要问题。命名实体识别和关系抽取作为信息抽取的两个核心任务,旨在通过对文档建模自动化地识别出文本中的实体及其对应的语义关系,并服务于众多下游任务:文本摘要、自动问答、知识图谱等。一般来说,传统的有监督实体识别和关系抽取多采用流水线策略。这样的策略之下,常常存在着错误传播,忽略子
近年来,随着汽车数量的不断增加,道路拥挤变得日益严重,随之而来的道路交通事故也在不断地困扰着交通管理者。为减少道路拥堵和人为因素造成的交通事故,世界各国将目光转移到了无人驾驶汽车领域。目前针对无人驾驶的关键技术研究已取得一定的成果,但在该领域依旧面临众多的问题,其中紧急工况下的无人驾驶汽车行为决策是急需解决的关键技术之一。基于深度学习理论的决策方法,因其所需大量行车数据训练模型,很难真正应用于无人
车辆轨迹预测是自动驾驶技术中承上启下的模块,通过收集感知模块的信息预测车辆的未来轨迹,为自动驾驶车辆躲避环境中的障碍物提供重要保障。但由于路网状况复杂、行驶环境不确定、环境中的障碍物种类繁多等问题,导致车辆预测轨迹和实际轨迹之间存在很大的偏差。因此,如何克服上述问题对轨迹预测的影响,提高汽车行驶轨迹预测的准确性、时效性是自动驾驶中急需解决的问题。本文研究内容如下:(1)对车辆轨迹数据和高精地图数据
位移作为桥梁结构健康的一个重要指标,它可推算出桥梁结构的动、静态特性。而传统的位移测量方法易受环境影响,不利于对其进行快速、便捷测量。将无人机与图像处理相结合的检测方法具有成本低、无接触、可快速部署和远距离多点测量的特点,受到了广泛关注。针对无人机图像的畸变,使用传统方法存在对图像质量和特征点的数量依赖性较高和无人机搭载能力受限的问题。本文首先采用深度残差网络估计了图像对应的单应性矩阵,从而对畸变
钢筋混凝土病害检测技术能够有效检测和预防混凝土建筑物的结构病害。深度学习网络因其强大的学习能力,被广泛应用于土木工程领域。深度学习中影响模型效果的常见因素便是训练数据不足,然而适用于深度学习数据集通常是稀缺的,迁移学习作为一种新兴的工具,能有效的解决上述数据短缺问题。而深度迁移学习正是通过深度神经网络来研究如何更好地利用其他领域(源域)的知识,提高目标域的学习能力的重要工具。为此,本文提出采用基于
由于植物姿态复杂多样和自身遮挡等问题,传统的基于单视角二维图像处理方法存在特征采集不完整、精度较低、通用性差等问题,已经不能满足植物表型学研究的需求。利用现代传感器(如深度相机、激光扫描、摄像头阵列等)数据采集,借助计算机视觉、图像分析、深度学习等最新算法,对观测植物进行多视角采集和三维模型重建,在三维空间进行植物器官分割,特征提取与分析,是当前植物表型研究的热门领域。本文提出一种基于深度学习和多
环境感知是智能汽车获取道路周围环境信息,从而做出控制和决策的基础。公路护栏作为道路交通中的重要环境要素,是智能汽车识别和检测的重要任务。现有的公路护栏目标检测多采用传统的数字图像处理方法,手工设计特征的方法复杂,对护栏的特征提取不充分,检测准确性和实时性不足。基于深度学习的护栏目标检测方法通过对护栏特征的提取和学习,能有效提高检测精度和速度。本文通过改进YOLOv4和Mask R-CNN,提出了两
随着自然语言处理技术的飞速发展,机器阅读理解逐渐成为学术界与工业界共同关心的热门话题,尤其是高质量数据集以及大规模预训练模型的提出更是促使这一领域取得了长足的进步。机器阅读理解作为关键的研究方向,其目的是使得机器能够像人类一样分析语义、理解自然语言并回答问题,从而可以提取文本中的重要信息。然而国内外机器阅读理解的研究主要集中在英文语境和部分中文特殊应用领域,如:司法、医疗、和军事等领域。由于中英文