论文部分内容阅读
近年来在金融量化领域中,金融基本面的多因子量化模型在投资选股、预测收益等场景中发挥了重要的作用;同时随着人工智能的发展,机器学习、深度学习等模型在量化投资领域的应用也取得了有效的成果,其中基于注意力机制的序列到序列模型在时序预测领域也发挥了重要的作用。本文在基于注意力机制的两阶段循环神经网络(DA-RNN)模型基础上,针对原模型的局限性做出了几点改进,设计了一种多维度融合注意力两阶段多任务循环神经网络模型。
本文模型在第一阶段基于层次注意力机制框架,在股票、行业、基本面因子三个维度建立注意力层。本文在股票层次中采用局部注意力机制,并结合龙头股票作为先验,在股票选择以及股票基本面选择上加入一定的随机性;在行业层次中对行业基本面和因子两个输入采用注意力之上的注意力,更清晰地表达行业板块之间的相互关系;在基本面层次中采用多维注意力机制,建模不同基本面指标类之间的相关关系,以捕捉不同粒度的融合信息。
本文模型在第二阶段利用不同时间点数据中的周期模式,同时建立了循环单元和循环跳跃单元,这样更好地发挥LSTM单元对长期依赖关系的记忆性;在注意力权重的计算中融合了自回归的思想,对局部的尺度变化问题进行建模。整个模型使用了多任务学习的框架,能够显著提高模型对所有基本面因子的建模能力,提高了模型的鲁棒性,对未来基本面因子的预测及选股有重要的意义。
通过对2009-2018年国内29个行业4317只上市股票的月度、季度、年度财报数据进行实证分析,本文一方面实现了对相关外部特征因子序列的选取,另一方面对长时间的时序依赖关系进行了有效建模,验证了其改进基本面因子的预测能力,从而实现人工智能与量化投资领域的交叉融合研究。
本文模型在第一阶段基于层次注意力机制框架,在股票、行业、基本面因子三个维度建立注意力层。本文在股票层次中采用局部注意力机制,并结合龙头股票作为先验,在股票选择以及股票基本面选择上加入一定的随机性;在行业层次中对行业基本面和因子两个输入采用注意力之上的注意力,更清晰地表达行业板块之间的相互关系;在基本面层次中采用多维注意力机制,建模不同基本面指标类之间的相关关系,以捕捉不同粒度的融合信息。
本文模型在第二阶段利用不同时间点数据中的周期模式,同时建立了循环单元和循环跳跃单元,这样更好地发挥LSTM单元对长期依赖关系的记忆性;在注意力权重的计算中融合了自回归的思想,对局部的尺度变化问题进行建模。整个模型使用了多任务学习的框架,能够显著提高模型对所有基本面因子的建模能力,提高了模型的鲁棒性,对未来基本面因子的预测及选股有重要的意义。
通过对2009-2018年国内29个行业4317只上市股票的月度、季度、年度财报数据进行实证分析,本文一方面实现了对相关外部特征因子序列的选取,另一方面对长时间的时序依赖关系进行了有效建模,验证了其改进基本面因子的预测能力,从而实现人工智能与量化投资领域的交叉融合研究。