论文部分内容阅读
数字化工业时代下,由于生产过程的密集和紧密联系,故障出现对于工业生产造成相当大的损失,能够通过工业传感器收集的时间序列数据分类判断工业设备状态,及时调整消除故障至关重要。而由于传感器数量巨大,种类繁多且高频采样,导致了工业大数据的复杂性,具有空间维度高,依赖关系复杂,规律多变,数据量大等特点。这些特点给工业时序分类带来了精准程度、高效性和自适应性方面的挑战。当前工业上使用的算法和时间按序列分类领域的优秀算法难以应对这些挑战。而目前端到端的深度学习算法在许多领域都有不错的表现,本课题对深度学习在工业大数据时间序列分类问题的应用进行了研究,针对工业数据的特点和工业时序分类的挑战,从精准分类、高效分类和增量学习三个方面入手。精准分类方面,本课题运用LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)设计了端到端的深度学习神经网络,提出了根据训练集序列单整阶数选择神经网络层数的网络结构设计方法,解决了神经网络模型结构自适应问题。在实验中,本课题提出的算法取得了97%-98%的分类准确率,较其他非深度学习算法提升了3.91%。高效分类方面,本课题运用SRU(Simple Recurrent Unit)和CNN(Convolutional Neural Network)设计了高并行的端到端深度学习神经网络,同时提出了Summarizer-Attention机制进一步提升了CNN的分类效果。实验表明,相较于本课题提出的精准分类算法,在准确率下降0.5%-0.8%的情况下,本课题提出的高效分类算法模型分类效率提升了1.39-5.27倍。增量学习方面,本课题设计了基于通过KL散度衡量数据分布差异的模型更新策略,借鉴迁移学习设计了基于数据分布映射的神经网络增量学习模型,解决了模型对数据分布变化的自适应问题。实验表明该增量学习策略和模型可以尽可能低频率地更新模型,同时长期保持模型对新数据分布的适应性和91.84%-96.92%的较高分类准确性。上述三个方面的研究共同组成了适用于工业大数据时间序列分类的算法体系,满足了工业时序分类的准确性、高效性和自适应性需求。其中包含的创新点有:通过分析训练集序列单整阶数解决神经网络模型结构自适应性;将时间相关特征总结为与时间无关特征的Summarizer-Attention机制;依据工业数据特点,使用数据分布差异和迁移学习的思想设计增量学习策略和模型。