论文部分内容阅读
近年来,随着互联网和大数据技术的不断发展以及公共建筑能耗系统的推广,建筑能耗平台中积累了海量的能耗数据。对于实现建筑节能的目标而言,进行能耗异常检测尤为关键。能耗异常检测任务旨在自动化检测能耗的各种使用异常,在节省人工异常检测成本的同时,也有助于及时找到引起异常的问题所在以防止异常继续扩散。另外,由于能耗异常往往会对能源的使用规划及其用量控制带来不利影响,因此,能耗异常检测对整体能源的分布与管控也具有重要意义。建筑能耗的异常检测方法在近年来发展迅速,然而目前相关研究仍存在以下问题亟待解决:(1)数据噪声处理问题:现有方法往往忽略了现实应用中传感器由于电压电流等波动引起的数据噪声现象,错误将数据噪声分类为能耗异常样本,导致模型的异常检测性能下降;(2)提取时序信息问题:现有方法缺乏充分考虑传感器数据中存在的时间序列信息,限制了模型的检测异常能力;(3)缺乏异常标注问题:能耗数据的异常类别标签通常需要依赖专家知识进行人工标注,由于需要耗费大量的人力成本,导致存在大量未标记的能耗数据。针对上述问题,本文提出了一种基于自注意力机制下时间序列自编码机的能耗异常检测算法。针对问题(1),本文提出使用变分自编码机的相关结构来提取数据特征的隐变量表示,通过引入高斯噪声进行采样训练的方式,增强了模型对噪声的鲁棒性及模型的泛化能力。针对问题(2),本文结合使用多层双向长短期记忆神经网络与自注意力机制,对数据的时序信息进行充分提取,提高数据的表示能力。针对问题(3),本文进一步提出了一种基于Kmeans聚类的半监督能耗异常检测框架,缓解了对异常标注的依赖问题。本文基于真实的某高校能耗数据集以及UCR开源的Italy Power Demand数据集与Arrowhead数据集,设计并进行了广泛的对比实验。实验结果表明,相较于目前业界主流的模型方法,本文提出的模型在准确率、召回率以及F Score等指标上表现更佳,验证了该算法的有效性。此外,本文还通过可视化案例分析对模式异常的识别区分效果进行定性分析,结果表明本文方法可以有效区分模式异常中的子序列异常和上下文异常。