【摘 要】
:
随着我国高铁动车组的数目越来越多,运营里程越来越长,高铁已成为人们出行的主要工具之一。高铁的运行安全一直受到有关部门的高度重视,这对保障高铁安全、高效运行的运维服务系统提出了更高要求。现代信息技术支撑我国高铁运维向数字化和智能化转变。在高铁运维智能化建设中,知识图谱等先进技术的应用已经开始。从大量的运维数据(如:维护手册、技术说明书、维修记录等)中抽取知识,并构成知识图谱,这对于提升运维系统的智能
论文部分内容阅读
随着我国高铁动车组的数目越来越多,运营里程越来越长,高铁已成为人们出行的主要工具之一。高铁的运行安全一直受到有关部门的高度重视,这对保障高铁安全、高效运行的运维服务系统提出了更高要求。现代信息技术支撑我国高铁运维向数字化和智能化转变。在高铁运维智能化建设中,知识图谱等先进技术的应用已经开始。从大量的运维数据(如:维护手册、技术说明书、维修记录等)中抽取知识,并构成知识图谱,这对于提升运维系统的智能化水平有重要的意义。但由于高铁运维相关的系统建设时间、采用的标准不同,难免会出现对同一物理实体表述不完全一致的问题,这导致从这些不同来源的数据抽取出的三元组集中存在对齐问题。针对上述问题,本文以动车组关键部件——牵引电机为研究对象,定义了牵引电机运维数据中的实体类和关系类,由此构建了三元组集,在此基础上提出了适应于高铁智能运维的嵌入实体对齐算法。本文主要研究工作如下:(1)在分析牵引电机运维数据的基础上,本文定义了7种实体类和6种关系类,为生成三元组集提供依据。为适应对齐场景,本文选取两个不同来源的数据集,形成两个三元组集。在此基础上构建了用于训练和测试的实体对齐数据集。(2)针对不同三元组集中相同语义的实体表述不一致的问题,本文使用基于Bert模型的文本匹配模型得到实体的通用语义。为弥补通用语义信息的不足,本文提出两种用于补充结构信息与对齐信息的嵌入实体对齐模型,它们分别是Trans H_align_Bert模型和RGCN_align_Bert模型。对提出的两种嵌入实体对齐模型进行对齐测试集上的命中率测试,结果证实RGCN_align_Bert模型性能更好。(3)将提出的RGCN_align_Bert模型集成到知识图谱构建工具中。在解决动车组运维知识图谱构建过程中的实体对齐问题中,相比只获取通用语义的基于Bert的文本匹配模型,RGCN_align_Bert模型表现出更好的性能。
其他文献
当前正处于大数据火热的时代,如何有效利用大数据是各个企业、高校以及政府部门等关注研究的问题。云计算虽然实现了多个客户端将数据集中上传至云端进行联合训练,但是随着隐私安全问题的披露和人们对隐私安全问题的重视,云计算技术在当下已经不太适用了。为解决隐私保护问题,谷歌提出了具有安全性能保障的联邦学习技术,各个客户端可以在数据保留在本地的前提下进行联合训练。这种技术不仅解决了不同企业或不同设备间存在的数据
命名实体识别主要是指从自由文本中将时间、地点、人物、国家、组织和事件等有价值的特殊实体名词提取出来,是自然语言处理中的一项基础任务。电子病历是指记录病人在医院进行治疗活动时产生的一系列具有规则的专业性文本。近些年来的电子病历命名实体识别研究经历了词典规则阶段、机器学习阶段和深度学习阶段,实体提取的准确度逐渐提升,但由于数据集稀少、病历数据敏感的原因,相对于其它自由文本的研究还是较少。目前病历命名实
在砂床上喷射粘结剂的3D打印是铸造用砂型的增材制造技术,已经在铸造新产品试制中大量应用,迅速发展,该方法缩短了传统铸造流程并且为砂型设计提供了更大的灵活性。然而,砂型在制备过程中存在着强度和发气性的主要矛盾,是制约3D打印砂型技术发展的关键因素。对材料进行计算断层扫描分析CT及其三维重构是研究材料内部结构的新方法。本文采用断层扫描技术和三维重构技术,对3D打印砂型微观结构和特性进行了分析研究,开发
在如今的信息时代,云存储、云计算、大数据这些概念已经慢慢的流行起来,成为人们耳熟能详的一些词语,全球信息技术迅速发展,随着网民数量增长,互联网设备接入数量快速增加,整体规模持续提升,同时,包括人工智能、云计算在内的各种新技术不断出现,进一步带动全球互联网数据流量不断增长,这就导致越来越多的网络服务商的出现,现在很多的政府、企事业单位、互联网公司、制造业等都需要进行日常工作中产生的数据存储和计算,而
我国已经建成世界上规模最大、运行工况最为复杂的交直流混联电网,交直流混联电网具有强大的输电能力,对我国能源和负荷在地域上存在的“源荷分布不均”问题起到极大的缓解作用,已成为电网发展的新形态。由于交直流混联电网结构复杂,当线路某处发生故障时,极易发展为大范围的事故,交直流混联电网的安全稳定运行一直是电力领域重点关注的问题。本文针对交直流混联电网的故障诊断问题展开研究,在现有故障诊断方法的基础上,研究
在“双碳”目标下,需求响应成为电力系统中十分重要的技术手段。由于生活水平的不断提高和产业结构的调整,电力负荷的峰谷差不断增大,若采用发电侧调节满足用电需求,电网不得不留有一定量的冗余发电能力,必定会造成资源浪费。而电力总负荷增长的同时,柔性负荷所占比例逐年递增,可以利用需求侧响应来调节供需平衡,然而需求响应过程中的不确定性不可避免,若忽略不确定性影响会使电网运行存在风险。本文对需求侧资源聚合运行特
牵引电机和轴承作为列车走行部的关键部件,保障其正常运转对行车安全和乘客安全具有重要意义,现阶段对轴承的故障诊断往往是对其传感器采集到的加速度信号这种直接信号进行研究,实际上轴承的故障会在设备间的相互作用中传递给相邻设备,进而在相邻设备的监测信号中体现出来,这里我们称这类监测信号为间接信号。间接信号作为直接信号的辅助信号可实现诊断精度的提高,同时在直接信号采集中断或异常时作为主要的诊断手段,对其进行
随着化石燃料的日益减少,能源问题在当今社会中越来越突出,甲烷以其储量备受人们的关注,但是甲烷属于温室气体,其温室效应是二氧化碳的25倍,不合理的使用将会加剧全球的环境问题。采用非平衡等离子体手段将甲烷、二氧化碳转化成目标产物是目前等离子体应用的研究热点,但是等离子体对目标产物的选择性较低,故本文采用非平衡等离子体与催化剂耦合的方式对其进行转化。本文主要针对甲烷、二氧化碳的干式重整开展研究,旨在实现
随着经济的快速发展以及机动车保有量的急剧增加,城市道路交通路网面临着巨大的考验。当前,通行需求的增加导致交通供求矛盾日益突出,由此引发的交通安全以及交通拥堵问题严重制约了城市的可持续发展。信号控制优化与交通路网的运行存在复杂的联系,合理的信号控制方案能有效提高路网的通行能力。随着交通领域的智能化发展,城市的信号优化要求有所提高,因此,如何利用智能技术对信号控制方案设计得更加合理,以缓解城市道路网的
如今,随着经济社会的不断发展,人类迫切地需要提升社会生产效率以满足日益增长的物质文化需要。无人化系统凭借其自动化程度高,无需或仅需少量人工操控,并且可全天候工作等特性,迅速成为学术界和科学界的研究热门。同时伴随软硬件的逐步发展和当今世界对智慧生活,智慧交通的迫切希望,当年无异于天方夜谭的无人车,无人机,无人艇等正在渐渐走入我们的生活。作为无人系统的基石和各种无人终端感知世界的“眼睛”,空间感知系统