论文部分内容阅读
在采集原始运行数据过程中,公共建筑能耗监测平台会受到很多外界因素影响,导致数据中存在缺失或突变等问题。因此,在分析公共建筑能耗数据挖掘之前,数据预处理已成为不可缺少的步骤,提高运行问题数据的填补精度已成为亟待解决的关键问题。公共建筑能耗中空调能耗占比相对较大,大约50%。公共建筑空调用电能耗数据能反映出建筑空调运行真实情况,分析挖掘该类型数据是减少未来公共建筑能源消耗的重要环节。目前,国内建筑空调数据预处理只采用一种单一算法填补所有的问题数据,还没有较为完整的处理体系,最终填补问题数据的精度相对不高。本文针对建筑空调实际运行用电能耗数据的特点及影响因素,提出合理有效的预处理方案,并引入多种算法,对比验证算法的预测填补精度。主要研究内容及结果表明:(1)识别缺失和异常的空调用电能耗数据。应用R语言采用简单语句直接识别缺失数据;将建筑异常数据分为连续重复和突变数据,采用直接识别和k-means算法相结合的方法识别所有的异常数据。(2)识别空调运行模式及其与建筑冷热负荷相关性,提出不同空调运行模式问题数据填补策略。将空调运行模式分为供热、制冷和新风三种模式,基于原始每个月的日平均空调用电能耗数据,依据k-means聚类结果和气候特点,判定每年每月空调运行模式。通过理论法和相关系数法判断每种空调运行模式的空调用电能耗数据与室外环境参数的相关度,得到每种空调运行模式与建筑冷热负荷的相关性。根据两者之间的相关性,将空调用电能耗数据划分为与建筑冷热负荷相关的空调用电能耗数据和与建筑冷热负荷无关的空调用电能耗数据,据此确定每类问题数据的填补算法,而不是之前只简单采用一种算法解决所有种类的问题数据。(3)针对填补与建筑冷热负荷相关的空调用电能耗问题数据,提出了一种BP-POS·SVR-BP混合填补算法。该算法能利用BP网络的优势更好地将寻找BPNN和SVR填补结果之间最佳权重系数组合。通过实验对比验证单个算法(BPNN、SVR)和混合算法的填补精度,发现混合算法填补精度更高。针对填补与建筑冷热负荷无关的空调用电能耗问题数据,对比验证KNN回归算法、均值插补、基于Mice多重插补三种算法填补精度,发现KNN回归算法填补精度更高。该研究对公共建筑能耗监测平台中空调用电能耗数据预处理方案及问题数据填补算法的选择提供了一定的参考作用,在该填补算法的基础上稍加修改,可应用于建筑能耗监测平台中其它分项用电能耗数据的问题数据,同时对空调能耗数据挖掘知识的准确性以及建筑节能提供了依据和保障。