论文部分内容阅读
随着工业界的快速发展,电网输变电设备日常检修维护工作中积累了大量设备故障案例检修记录,文本匹配技术从大量的故障案例数据中挖掘出与目标故障案例相似度高的案例,对现场运检人员遇到新故障时快速判断和检修决策具有重要参考价值.当前,大多数文本匹配的方法都是通过构建卷积神经网络(Convolutional Neural Networks,CNN)、长短期记忆网络(Long Short?Term Memory,LSTM)模型来计算文本之间的相似度,忽略了海量无标签文本数据中潜在的深层语义信息.因此,构建一种新型的文本匹配模型将相似案例匹配问题转化为句子对的二分类问题,利用改进的预训练语言模型(Bidirectional Encoder Representations from Transformers,BERT)提取句子对的深层语义特征,进而接入分类模型捕获句子对的语义相似度.试验表明所提出的方法在故障相似案例数据上相比于CNN、LSTM有更高的匹配准确率.