论文部分内容阅读
时间序列数据普遍存在于交通、金融、物流、天文等很多领域,其中含有很多有价值的信息,因此对时间序列进行挖掘引起了很多研究学者的关注,时间序列挖掘主要包括关联规则的分析,时间序列的线性表示,相似度比较,模式提取,异常的检测,时序预测等,针对时间序列进行的研究具有非常重要的意义。时间序列数据通常数据量大,在原始的时序数据上进行分析,计算复杂,并且存储成本高,算法的执行效率会很低,有时需要以一种近似的压缩序列来替代原始的时间序列,从而提升算法的执行效率,因此对时间序列线性表示的研究具有很重要的意义。本文从时间序列线性表示和时间序列的预测两个角度对时间序列进行研究。为了实现时间序列的线性表示,本文提出了一种根据时间序列重要点进行分段的算法即PLR_TSIP方法,这种方法不仅考虑到了分段后的时间序列的总体拟合误差同时也考虑到了该分段时间序列的长度。通过多组实验数据以及与其它的分段算法进行分析比较,该算法不仅提升了拟合的精度同时提高了时序压缩的效率。本文以股票数据进行时间序列的预测研究,为了更好的研究股指预测问题,提出了基于PCA与LSTM模型的股指预测方法,即包含应用主成分分析进行降维和利用LSTM网络进行训练预测两个步骤。在实验中,应用LSTM模型对纳斯达克股票指数数据和标普500指数数据进行预测,通过对LSTM网络进行调参,达到了比较好的实验结果,实验结果表明该方法既提高了训练的效率也提升了预测的精度。