论文部分内容阅读
现实生活中充满了时间序列数据,金融交易、电商消费数据、医疗记录信号无不包含了复杂的时间序列数据,准确、高效的时间序列处理方法非常具有现实意义。实际的时间序列数据往往包含了复杂的非线性动态,而深度学习恰恰具有非常强大的建模能力;理论上,一个复杂的深度神经网络可以逼近任意函数。针对序列数据,基于深度学习的方法发展出了如循环神经网络一类高效的序列预测器。本文基于深度学习方法和统计学习方法,针对能源市场价格预测问题中的复杂动态、非线性、周期性和趋势性等问题发展出一系列针对该问题的算法和策略。本文主要包括如下内容:(1)以欧洲能源交易所法国市场为例详细分析了能源市场价格预测问题,并将该问题形式化为一个时间序列预测问题。针对传统时间序列处理方法在处理复杂非线性时间序列数据时的困难,本文将统计机器学习方法引入到能源市场价格预测中;针对统计机器学习模型容量较小、时间序列动态复杂的问题,本文采用模型动态更新的策略来提高模型追踪时间序列动态的能力。为了降低模型在频繁更新模型中的计算消耗,本文提出了一种针对流式数据高效动态更新的在线核岭回归(Online Kernel Ridge)变种;(2)为了提高模型容量,并提升模型捕捉时间序列长时依赖的能力,本文将循环神经网络(RNN)引入到能源市场价格预测问题中。具体的,针对时间序列数据的特点,本文提出了状态连贯的RNN,并基于此提出了状态平滑,一种针对时间序列数据的循环神经网络的训练技巧。此外,本文基于门控循环单元结合状态平滑设计了一种简单有效的网络结构,改善了模型在捕捉复杂非线性和长时依赖的能力;(3)现实中的时间序列往往因为人类活动的往复性具有一定的周期性,在能源相关的预测问题中周期性显得非常明显。另外,实际的能源市场价格预测系统还需要有效捕捉价格序列的趋势性。为了在神经网络中显式的建模能源市场价格中的周期性和趋势性,本文提出了周期损失和趋势损失,并基于多任务学习训练神经网络。实验表明周期损失和趋势损失可以增加模型的泛化能力,并且增加模型在预测序列趋势时的精度。