论文部分内容阅读
近几年随着机器学习的快速发展,不少机器学习方法被用于控制系统的前馈控制中。在空调系统中,最通常使用的两种机器学习方法是神经网络和支持向量机。但是大部分的机器学习方法都需要事先拥有标签信息,本文考虑到工业过程数据众多、标签信息较少、样本标注困难的现状,从半监督角度出发,研究半监督聚类算法为工业数据做标签标注,并同时以半监督聚类算法为基础改进空调控制算法。本文在前人研究基础上,为了改进快速密度峰值聚类算法,使其拥有更好的聚类效果和更广的应用领域,提出了基于集成学习的半监督约束快速密度峰值聚类和基于增强类结构挖掘的半监督约束快速密度峰值聚类两种半监督密度聚类算法。而后,为了对空调控制算法进行改进、完成空调数据标注和负荷预测,本文把基于增强类结构挖掘的半监督约束快速密度峰值聚类算法用于空调控制,提出了基于半监督聚类负荷预测的空调改进控制算法。本文的主要研究工作和成果包括以下几点:1)针对快速密度峰值聚类算法需要人为确定中心点、算法聚类质量与参数选择密切相关以及算法处理的数据类型有限的问题,本文提出了一种基于集成学习的半监督约束快速密度峰值聚类算法。通过引入半监督信息和集成学习,算法可以在只标注少量约束关系的前提下,用集成学习扩充约束信息,保证算法能够在不影响聚类精度的同时,又能够增强对约束信息的使用。基于多个公开数据集和仿真空调数据集的实验证明,在相同的约束量前提下,针对大样本数据,基于集成学习的半监督约束快速密度峰值聚类算法相比其它半监督聚类算法具有更高的聚类精度。2)针对基于集成学习的半监督约束快速密度峰值聚类算法在数据量较少时算法聚类精度提升不明显、算法总体时间复杂度相对较高的情况,本文提出了一种基于增强类结构挖掘的半监督约束快速密度峰值聚类算法。该算法在聚类过程中增强了类结构的层次关系,以这种层次关系代替集成学习的使用,加快了算法运行速度,并尝试在最终融合的过程中用支持向量机改进融合步骤。基于增强类结构挖掘的半监督约束快速密度峰值聚类算法是少有的结合了密度聚类、层次聚类和半监督聚类三个思想的算法。基于多个公开数据集和仿真空调数据集的实验证明,当约束量相同,算法在小数据量时聚类精度有较为明显的提升,在大数据量时能够大幅提升算法的聚类性能,并且比其它半监督聚类算法拥有更快的运行速度。3)针对楼宇多联空调系统,在对传统空调控制经过结构调整得到的基础控制算法基础上,提出了基于半监督聚类空调负荷预测的控制方案。使用半监督聚类对工业数据进行标注并用于前馈控制是一种全新的尝试,新的控制算法在用半监督聚类对空调数据进行标注的同时,让聚类算法学习数据的结构分布。由此拥有学习数据分布能力的半监督聚类算法在有新的空调运行数据进来时可以比对结构信息,然后把预测出的结果作为前馈信号用于空调控制,从而可以让控制系统及早预知负荷的变化。在仿真空调模型上的实验证明,基于半监督聚类空调负荷预测的控制方案比起无负荷预测的基础控制算法拥有更好的控制性能和节能效果。