论文部分内容阅读
在股票市场中,不同的投资者们会采用五花八门的投资策略,但近年来价值投资类投资者的队伍愈发壮大,A股市场整体风格上也正在从投机、技术分析向投资、基本面分析转变。量化投资也是一个在中国快速发展的投资方式。量化投资中热门的因子投资主要是以用基本面数据设计的因子为基础。但是,传统量化选股模型往往以预测股价或收益率为目标,同时因子投资策略也只是简单地使用已公布的数据。本文作为产品设计,围绕“预测公司基本面而非股价”的理念,弥补了传统因子投资的不足,提供了一个更优的量化投资产品。本产品的核心是利用大量数据和机器学习算法训练出的、能够预测公司基本面因子的量化模型,称为前瞻因子模型(LFM)。具体地,在选定变量,以及获取和预处理数据之后,本文将数据集分割成了样本内训练集和样本外测试集。然后,本文从若干模型中挑选出了LSTM神经网络作为LFM的结构,并在样本内进行了十折交叉验证,结果表明LSTM能够适应本文的任务;在样本外进行回测时,本文以LFM在样本外的预测结果为基础,得到了每个交易日的交易信号,满仓、等权重地持有25只股票,在2016年10月31日至2019年9月30日期间取得了44.6%的累计收益率和13.76%的年化收益率,远超本策略对标的传统单因子策略;和业绩基准沪深300比较,本策略收益率的波动略大,但也换取了很高的超额收益,因此Sharpe Ratio、Sortino Ratio都较高,明显跑赢了基准。最后本文对策略的回测结果进行了归因分析:从Brinson归因分析的结果来看,由于本策略一直保持满仓,超额收益中主动配置的影响较小,超额收益主要来自标的选择的影响,即本策略是靠选股来战胜市场的;从因子分析来看,FF五因子分析和Barra因子分析都表明本策略偏好配置中小盘的成长股,但不倾向于配置大盘股和价值股。总之,本文设计的产品在样本外的业绩显著优于传统因子投资策略和沪深300指数,并通过对LFM的模型评估和投后的归因分析,找到了本产品的选股风格和收益来源,是值得投资者信赖的量化投资策略。此外,本文为基本面预测模型提供了新的实用价值,并为金融数据分析的模型选择、因子投资的研究思路提供了参考。