基于自注意力机制下时间序列自编码机的能耗异常检测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lieying110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网和大数据技术的不断发展以及公共建筑能耗系统的推广,建筑能耗平台中积累了海量的能耗数据。对于实现建筑节能的目标而言,进行能耗异常检测尤为关键。能耗异常检测任务旨在自动化检测能耗的各种使用异常,在节省人工异常检测成本的同时,也有助于及时找到引起异常的问题所在以防止异常继续扩散。另外,由于能耗异常往往会对能源的使用规划及其用量控制带来不利影响,因此,能耗异常检测对整体能源的分布与管控也具有重要意义。建筑能耗的异常检测方法在近年来发展迅速,然而目前相关研究仍存在以下问题亟待解决:(1)数据噪声处理问题:现有方法往往忽略了现实应用中传感器由于电压电流等波动引起的数据噪声现象,错误将数据噪声分类为能耗异常样本,导致模型的异常检测性能下降;(2)提取时序信息问题:现有方法缺乏充分考虑传感器数据中存在的时间序列信息,限制了模型的检测异常能力;(3)缺乏异常标注问题:能耗数据的异常类别标签通常需要依赖专家知识进行人工标注,由于需要耗费大量的人力成本,导致存在大量未标记的能耗数据。针对上述问题,本文提出了一种基于自注意力机制下时间序列自编码机的能耗异常检测算法。针对问题(1),本文提出使用变分自编码机的相关结构来提取数据特征的隐变量表示,通过引入高斯噪声进行采样训练的方式,增强了模型对噪声的鲁棒性及模型的泛化能力。针对问题(2),本文结合使用多层双向长短期记忆神经网络与自注意力机制,对数据的时序信息进行充分提取,提高数据的表示能力。针对问题(3),本文进一步提出了一种基于Kmeans聚类的半监督能耗异常检测框架,缓解了对异常标注的依赖问题。本文基于真实的某高校能耗数据集以及UCR开源的Italy Power Demand数据集与Arrowhead数据集,设计并进行了广泛的对比实验。实验结果表明,相较于目前业界主流的模型方法,本文提出的模型在准确率、召回率以及F Score等指标上表现更佳,验证了该算法的有效性。此外,本文还通过可视化案例分析对模式异常的识别区分效果进行定性分析,结果表明本文方法可以有效区分模式异常中的子序列异常和上下文异常。
其他文献
汉字是一种独特又美丽的书写符号。它不是线条的简单组合,而是保留原始图像灵魂和丰富文化意涵的文字。因此教师可以利用这一点来促进对外汉字教学,以此吸引留学生学习汉字,
由于城市不断发展,我国城市化水平越来越高。与此同时,城市用地逐年减少,建筑废弃物产量与日俱增。建筑废弃物无处填埋的现象成为社会难题。因此,从国家到地方层面,政府颁布
随着互联网技术和计算机技术的不断进步,人们对数据分类的要求也越来越高。普通的分类问题通常只含有一个标签或者是互斥的多个类别,但现在已经有很多的应用场景已经超出了上
本文以乌干达的银行数据为基础,旨在研究银行的成本收益对其资产收益率和股权收益率的影响,以及相关银行的金融稳定性。本文的样本来源于乌干达银行图书馆,主要由14家银行从2
条形柄锈菌(Puccinia striiformis f.sp.tritici,Pst)引起的小麦条锈病(wheat stripe rust or yellow rust)是小麦上的重大病害,培育抗病品种是防治小麦条锈病最经济、有效、
生物质废弃物厌氧产酸发酵过程中,需要施加产甲烷抑制手段来抑制终产物甲烷的生成,避免甲烷的产生消耗过程中产生的脂肪酸。传统的产甲烷抑制手段有添加化学产甲烷抑制剂、进
过渡金属硫族化合物(TMDs)具有石墨烯类似的层状结构。例如二硫化钼(Mo S2),层内的钼原子与硫原子以共价键相结合,层间以范德华力相结合。过渡金属硫族化合物纳米片由一到数
高碱燃料在燃烧过程中存在燃烧设备结渣、沾污和腐蚀等问题,严重限制了高碱燃料的大规模利用。硫酸盐化反应可以将碱金属氯化物转化为熔点更高、腐蚀性更低的硫酸盐,从而减轻
自由基学说中指出机体之所以衰老,主要是因为生物体内氧化与抗氧化的动态平衡遭到破坏,引起体内自由基堆积,对机体产生不可逆破坏,导致氧化损伤与衰老。而运动训练、机体疲劳
丁香酚属于植物体内的次生代谢物质,能在常温下挥发、且具有一定芳香气味,是一类食用安全性较高的物质。丁香酚不仅能够矫正食品的异味、赋予香气,而且具有抗菌生物活性,在果