论文部分内容阅读
作为动态数据分析处理的一个重要方向,时间序列预测在很多研究领域中引起了广泛的注意。许多关于时间序列预测的算法也被提出。而在对未来某点预测时,已有的方法大多只保留与预测点临近的数据,而丢弃大量与预测点相隔久远的数据。然而,某些情况下,可能无法获得足够的与预测点相近的新数据,此时为了能更好地对目标点预测,我们可以从大量相距久远的旧数据中提取有效信息,并将其应用到当前的预测任务中。鉴于时间序列的时效性,旧数据和新数据之间通常有较大的差异,直接利用旧数据辅助预测是不可行的,因此,在时间序列预测问题中,如何在相隔时间久远的数据之间迁移信息是比较有挑战性的工作。针对上述问题,本文提出了TrEnOS-ELMK(a hybrid algorithm based on transfer learning,ensemble learning and online sequential extreme learning machine with kernels)算法,并将其应用于单步时间序列预测。相对已有的关于时间序列预测的方法,TrEnOS-ELMK能最大程度地利用充足的、与预测点相隔久远的旧数据,而非直接将旧数据丢弃。然而,由于时间序列的时效性,相隔久远的新旧数据之间有着很大的差别,直接利用旧数据辅助训练是不可行的,为了解决该问题,在本文中,我们基于迁移学习为时间序列预测搭建一个新的算法框架。鉴于极限学习机(Extreme Learning Machine,ELM)算法的高效性,TrEnOS-ELMK以核ELM为基模型。考虑到在某些情况下,时间序列数据可能是实时更新的,算法融合了在线学习的相关思想,来处理样本非一次性获得,而是依次到来的情况。同时,鉴于集成学习的有效性,算法生成多个基模型,并对各基模型的权重实时更新,以保证集成集的高效性。在3个人造数据集和6个真实数据集上的实验结果证明了该算法的有效性。TrEnOS-ELMK主要可处理单步时间序列预测,以此为基础,本文针对多步时间序列预测提出了相应的MultiTL-KELM(a hybrid algorithm based on multi-task learning,transfer learning and kernel extreme learning machine)算法。相对于单步预测,多步时间序列预测面临更多的不确定性,引起此现象的原因较多,包括误差累积,信息缺失等。已有的关于多步预测的方法大多着重解决前者而相对忽略后者,MultiTL-KELM则可将间隔久远的旧数据有效利用到当前的预测任务中,从而缓解信息缺失的影响。不同于迭代预测和直接预测算法,考虑到需预测的未来各点的联系,本方法结合多任务学习,将对各维的预测看成是不同但相关的任务。这样,从一个任务中获得的信息可以对接下来的任务预测产生帮助,且各个任务可以并行。我们在6个数据集上对算法进行验证,得到了较好的结果。