论文部分内容阅读
证券数据是一种时间序列,具有高度的复杂性和不确定性,通常只有极少数交易者能掌握证券数据趋势特征。机器学习通过对证券历史数据的学习和自动优化算法,可模拟或实现人类的思维模式获取数据信息或特征,因此是对证券数据趋势特征分析的有效技术。本文采用卷积神经网络和长短期记忆网络这两种机器学习模型,以及分类和回归两种分析方法来提取证券历史数据中的趋势特征,包括:趋势分类、趋势强度和趋势续航力。主要研究内容有:(1)获取并预处理证券历史数据。本文采用的证券历史数据包含日线证券历史交易数据和日线大盘指数数据,其都是从新浪财经网站爬取而来,然后将日线数据进行预处理,包括了数据补齐,日线数据合并为周线数据、每日周线数据等。最后计算证券数据的技术指标,包含了均线、平滑异同平均线等。(2)标记历史数据标签。本文采用监督学习,需要在训练过程中输入期望的结果值。本文根据平滑异同平均线技术指标,标记了每日周线数据的三种趋势特征,作为训练中期望得到的结果值。(3)进行机器学习模型训练。本文分别采用卷积神经网络和长短期记忆网络为基础,构建了两种机器学习模型。这两种模型均用sigmoid函数或者softmax函数分类得出趋势分类;线性回归函数拟合趋势强度和趋势续航力;以交叉熵或者最小均方误差为其目标方程;以自适应学习率算法为其优化函数。训练结果表明,机器学习模型的最终损失值成功收敛,说明模型的学习过程有效。(4)回溯测试。通过比较模型的输出值与实际值的准确率或者误差值,来评价本文所采用机器学习模型对于趋势特征的提取效果。回测结果表明,本文提出的学习模型取得约70%的分类准确率,分类效果良好;趋势强度相对误差值在50%以内;趋势续航力相对误差值大多数高于50%。最后,通过回测结果的比较和分析,还给出本文最优的机器学习模型结构。本文提出的基于机器学习的证券数据趋势特征提取模型,通过学习具备了趋势特征提取能力,本文最后回测结果表明该模型的有效性。