基于知识图谱的火电领域文本选择系统研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:zhangnly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与互联网的不断发展,社会逐渐进入了智能信息化时代,各行各业的信息也呈指数增长。近些年新技术与专业领域相结合成为了一种研究趋势,也不断地为人们提供了诸多便利,知识图谱的快速发展可以将这些杂乱的数据信息关联起来,提升数据的利用率,能够更好地进行知识挖掘。现有知识图谱大多都面向的百科知识领域,在特定领域方面的知识图谱构建比较少,因此,本文针对特定领域的知识图谱构建和文本选择系统展开研究。主要研究内容如下:(1)领域知识图谱构建。提出了融合BERT的Bi LSTM-CRF命名实体识别模型。在构建知识图谱之前,首先针对命名实体识别任务进行研究,提出将特定领域知识数据加入到BERT预训练模型中,然后连接Bi LSTM-CRF完成命名实体识别任务,该模型在传统的Bi LSTM-CRF模型上增加BERT预训练模型,提升了模型对上下文的理解,能够更好的识别出实体。通过在人民日报数据集和特定领域数据集上进行实验,命名实体识别的准确率均高于其他对比算法,实验证明该方法的有效性。(2)改进NSGA-II的文本选择模型。本文根据构建的领域知识图谱,对输入的语句根据专业知识进行知识推理和知识表示,能够生成一定量的专业描述。为了使生成的文本更具有针对性,提出将多目标优化算法应用于文本序列排序中。本文将NSGA-II优化算法进行改进,提出将差分变异策略来代替NSGA-II的变异策略,并将差分变异策略中的控制因子进行自适应调节,使得算法在收敛性和分布性上都有有效的提升,实验证明该改进算法在GD、IGD、SP指标上均优于同类算法。(3)本文将特定领域的知识图谱作为基础,构建了火电领域的文本选择系统平台,通过分析项目需求、系统特点,对该平台进行主体的功能设计。结合知识图谱可视化和文本选择两方面需求,设计了搜索功能、文本展示功能、图谱可视化功能。本文对系统架构进行设计,总体分为数据层、图谱层、应用层,通过系统运行测试,实现了基本设计的功能。
其他文献
互连网络是大规模计算机系统内部处理器之间的连接方式,它可以用无向连通图来表示。图中的顶点代表系统中的处理器,边代表系统中处理器之间的连线。k元n立方体网络由于自身优良的拓扑性质,如易于实现、低延迟,已成为目前重要的互连网络之一。在对互连网络的研究中,网络是否具有哈密尔顿性和不交路覆盖性是十分重要的研究课题。随着多处理器系统规模的不断扩大,处理器以及处理器之间线路出现故障的可能性越来越大。因此,研究
随着我国高端装备制造业的快速发展,对高温环境下使用的耐热不锈钢需求的数量日益提高。目前我国对于耐热不锈钢的使用性能要求越来越高,尤其对于较高温度下的氧化性能要求更加严格,因为高温下良好的抗氧化性能是不锈钢在使用过程中保证寿命和安全的关键因素。通过研究耐热不锈钢的高温氧化性能,来进一步提高耐热不锈钢的性能,拓展其应用领域,为以后提高氧化性能奠定基础。本文所用的实验材料是改进后的国产奥氏体不锈钢309
随着当前信息量的日益增加以及科学技术研究的不断深入,人们对计算机的计算和存储的性能的要求越来越高,所以,大规模并行计算机系统随之产生。互连网络是大规模计算机系统内部处理器之间的连接方式,可以用无向连通图来表示。图中的顶点代表系统中的处理器,边代表系统中处理器之间的连线。在大规模并行计算机系统中,互连网络对整个并行计算机系统的稳定运转起着重要的甚至是决定性的作用。随着计算机系统规模的不断扩大,各个部
竞争图是图论中非常重要的图类,广泛应用于噪声信道下通信的研究,无线电广播研究,生态系统等方面。在研究竞争图的过程中,Cho和Kim等人提出有向图的竞争指数的概念。近年来,研究者对竞争指数产生了兴趣。竞赛图是有向图理论中研究关注度最高、内容最丰富的图类之一,Bang-Jensen等人刻画了竞赛图的结构、分类以及相关结论。此后,这类图引起了研究者的广泛兴趣,并得到了许多有意义的结果。竞赛图的一种重要子
CsPbX3钙钛矿在宽色域范围、高颜色纯度、高量子产率等方面的优势突出。因此在照明、多维加密、光电探测等领域引起了很大的回响。但是CsPbX3钙钛矿也存在少许缺点。如含有污染环境、损害人体心血管系统的重金属元素铅;如发射波长在蓝紫光区域的CsPbCl3量子点的产率极低;如发射波长在红光区域的CsPbI3量子点的稳定性较差。CsPbX3钙钛矿量子点是离子晶体,不同组分的钙钛矿量子点之间,因容易发生离
随着计算机的普及和发展,并行计算机系统的规模迅速扩大,系统中处理器的数目显著增加。在使用过程中,很多大规模并行计算机系统要求不间断地工作,从而增大了系统处理器发生故障的可能性。因此,要保证系统安全可靠地运行,就必须能及时、准确地检测出发生故障的处理器并进行更换。在故障诊断中,连通度和诊断度是两个重要的参数。传统的连通度和诊断度允许每个顶点的邻点同时出现故障,而在实际应用中,这种情况几乎是不可能出现
随着深度学习在计算机视觉领域的发展与应用,越来越多的成功算法应用在许多工业领域中,例如,汽车辅助系统。汽车辅助系统可以对道路信息进行识别,并将结果反馈给驾驶者,从而使驾驶者在道路中集中注意力在操作汽车上,进行安全驾驶。在道路信息中,交通标识牌是一类重要的信息,为了保证驾驶汽车的安全性,在高速行驶的过程中快速且准确的检测出交通标识牌的信息具有重要的应用价值。对于目标检测有较高的实时性要求的工业领域中
在量子信息理论中,蕴含在量子态中的量子关联是一种非常重要的物理资源,其中量子纠缠在诸多量子关联中尤为重要.在两体复合量子系统中,关于量子态的纠缠探测与纠缠度量已经有许多有价值的研究结果.然而在多体复合量子系统中,由于量子态的可分情况比较复杂,涉及诸多可分性定义,比如完全可分、半可分、强k-可分以及k-可分等,因而探测其可分性和度量其纠缠程度是比较困难的.如何识别两体或多体量子态是否纠缠及如何量化其
随着信息时代的高速发展,科技水平的逐渐提高,各个领域对计算机和Web等软件系统的依赖程度不断提高。尤其是在金融、军事等领域,人们对软件系统的安全性和可靠性提出了更高的要求。然而长期不间断运行的系统中仍然存在着大量的软件老化问题,使得系统的安全性和可靠度受到了严重威胁,产生无法估计的损失。对于已经发生了老化的软件系统,通过主动地进行抗衰操作,这样就可以有效地避免软件故障的发生或者失效。如果我们能够准
桥式起重机通常安装在车间上方,其工作区域横跨整个厂房,由于独特的结构形式和安装位置,不受地面设备及物料的限制,使得结构下面的广阔空间得以充分利用,故常被作为工厂内物料搬运的主要设备。伴随现代工业的快速发展,物料的重量和搬运频率急速增加,桥式起重机繁“”重”的工作特点也越趋明显,随之引起的事故也越来越多,相关的损失和不良影响也越来越大,因此对桥式起重机整机工作状态进行研究,具有很强的现实意义。在桥式