论文部分内容阅读
时间序列分析是揭示自然现象和认识客观世界的重要手段,近年来,时间序列预测成为了热门的研究领域,广泛应用于金融数据分析、空气质量评估和交通流量预测等等各个领域。随着科学技术水平的不断提高,人们由单变量的时间序列分析转为多变量的复杂时间序列分析,通过对系统的多个成分分析以提高预测精度,但现有的复杂时间序列预测方法仍存在以下几个挑战:一是异常数据的干扰,大多数预测模型对异常数据的容忍度很低,而复杂时间序列的无标签性和非平衡性使异常数据难以被检测;二是噪声成分的干扰,噪声成分导致时间序列的自相似性遭到破坏,而复杂时间序列中有用成分和噪声成分的界限模糊,降噪存在丢失有用成分的风险;三是复杂时间序列的多成分之间存在复杂的相互依赖关系,使预测变得困难。针对这些问题,本文从复杂时间序列异常检测、噪声去除和预测这三个方面展开研究,具体工作和研究成果如下:(1)针对挑战1,本文提出了一种基于预标注和多目标生成对抗网络的异常检测方法。通过预标注正常数据和训练多目标生成网络生成异常数据解决复杂时间序列无标签性和非平衡性的问题,最后通过生成网络和判别网络的对抗博弈得到异常检测分类器。在公开数据集上证明了该异常检测方法的有效性。(2)针对挑战2,本文提出了一种基于自适应白噪声的完全经验模式分解和自适应阈值的降噪方法。通过时间序列分解将有用成分和噪声成分在频域区分,并构造自适应的启发式阈值函数,在降噪的同时尽可能保留有用成分。在添加不同噪声强度的模拟时间序列上证明了该降噪方法的有效性。(3)针对挑战3,本文提出了一种基于注意力堆叠长短期记忆神经网络的复杂时间序列集成预测方法,并将异常检测和噪声去除作为预处理部分。通过堆叠长短期记忆神经网络提取复杂时间序列特征,引入注意力机制获取带权重的特征输入,并通过集成算法增强了预测能力。以北京和广州的空气质量指数PM2.5为分析对象,证明了该预测模型的有效性,同时也证明上述异常检测方法和降噪方法的有效性。