论文部分内容阅读
时间序列数据的分类和预测是数据挖掘领域的一个重要研究方向。线性模型曾广泛应用于众多领域问题的解决。然而,这些模型需要通过特征工程从数据中提取特征,并且也难以保证有预期的效果。由于现实世界中的序列数据往往规模很大,如何有效利用深度学习实现更加准确的序列数据分类和预测成为一个重要的研究课题。为此,本文开展基于深度学习的时间序列分类和预测研究。论文的主要贡献与创新点如下:1、通过上下文长期短时记忆(CLSTM)和上下文卷积神经网络(CCNN),以自监督(无监督)方法进行特征提取,并将其输入到注意力模块,之后再将结果输入到独立的多层感知器(MLP)模块进行处理,之后在完成层实现分类任务。为了解决本文的分类模型面临的过拟合问题,我们在每个阶段都要调整改变神经元的数量。其次,在模型的每个块的每一层之后设置了随机失活(dropout)。在加州大学UCR数据集上的实验结果表明,本文所提出的模型由于基准的对比方法。2、针对房产待售时间(DOM)这一投资领域的重要问题,本文提出了一种基于混合深度学习网络的预测算法。该算法通过基于CNN的注意力机制(CNNA)以及双向LSTM(BLSTM)模块来捕获待售房产属性。同样的,为了解决预测模型过拟合,本文在几乎所有模块中引入了 dropout。另外,通过百分位自举置信区间(CI)或加速修正百分位偏差(BCa)自举CI,并根据特征的估计分布决定数据集的四个属性的置信区间。最后,在上海某著名房地产企业的数据集上的实验结果验证了本文算法的有效性。3、针对股票价格的建模和预测问题,提出了一种解决股票价格预测问题的深度学习模型。其中AB-CNN和CB-LSTM都可以捕获股票的属性,然后组合它们的结果。之后,级联块的结果被送到最后的MLP模块。此外,LSTM和Attention机制都被合并到该结构以捕获非常长期的股票信息数据。本文在代号为“JNJ”的纽约证券交易所著名股票上进行了实验,结果表明,本文提出的算法优于单独的深度学习方案,统计技术以及其他的机器学习方法。为了指出一些短期交易机会,本文还针对一些包括移动平均线(MA),移动平均收敛散度(MACD)曲线,MACD直方图,以及相对强度指数(RSI)等指标对股票数据集进行了评估。以上三个工作探索了三种不同领域中的混合深度学习方案,即时间序列分类、预测房地产的待售天数以及预测股票市场中的股票价格。相关的实验结果揭示了混合深度学习方案在解决现实问题具有更好的性能。