论文部分内容阅读
量化投资是一种新型的投资方法,与传统的投资方法相比,它可以快速地获取并处理大量数据,同时也有着不受情绪左右、保持分析方法和投资逻辑的一致性等特点。我国的量化投资尚处于起步阶段,相关理论尚不成熟,因而具有很大的发展空间和研究价值。多因子选股策略是目前我国量化投资领域应用和研究最广的策略之一,具有灵活多变、能够适应变化的市场环境等优点。多因子选股策略的核心在于多因子模型的构建,而模型的构建则包括因子的选择和模型的选择两个部分,因子的选择在于确定解释变量,模型的选择在于确定解释变量的整合方式,但目前绝大多数学者都把研究的重点放在寻找能够更好地解释收益率的因子上,而在模型选择上则是默认使用多元线性回归模型,该做法实际上忽略了对模型层面的研究,广义上对多因子模型的完整研究应该包括模型研究和因子研究两个层面。基于此,本文分别从因子层面和模型层面来研究多因子选股模型。在因子层面,本文首先研究了线性多因子模型与Logistic多因子模型的基本原理、假设前提以及模型结论。从假设前提着手,分析比较了 Fama-French三因子模型、Fama-French五因子模型以及Barra风险模型中因子的合理性与完备性,确定了以Barra风险模型中的10个风险因子以及28个行业因子作为模型的备选因子。其次,研究分析了 Barra因子的构造方式、理论内涵以及数据来源,构造了包括行业因子在内的38个Barra因子,并分别使用简单分位法和行业中性化处理后的分位法对因子预测收益率的能力进行了单因子实证检验。在模型层面,本文首先构建了基于Logistic回归的Barra因子选股模型,并且分别在不存在交易成本的理想环境下以及存在交易成本的实际环境下对模型选股能力的优劣进行了回测分析,并对两种环境下模型选股能力的不同进行了研究分析。其次,本文对基于Logistic回归的Barra因子选股模型进行了比较研究,一方面比较了不纳入行业因子的选股模型与纳入行业因子的选股模型选股能力的强弱,另一方面比较了基于多元线性回归的Barra因子选股模型与基于Logistic回归的Barra因子选股模型选股能力的强弱。通过使用2013年1月1日至2017年12月31日的日数据进行回测分析,本文发现,Barra中国股市模型中的10个风险因子能够有效地预测收益率,其中Beta、Momentum^ Btop^ Liquidity^ Earnyield ^ Growth、Leverage因子越高的公司未来短期收益率越高,Size、Rresvol、Nlsize因子越高的公司未来短期收益率越低。使用10个Barra风险因子与28个行业因子构造的基于Logistic回归的选股策略能够获得超过沪深300指数基准的绝对收益,其中在不考虑交易成本的理想环境下策略能够获得60%的年化收益率和1.64的夏普率,在考虑交易成本后策略收益下降较大,但仍能获得17%的年化收益率和0.46的夏普率并且这两项指标都要优于沪深300指数基准,策略具有理论研究价值和实际应用价值。纳入行业因子的选股模型无论在收益性还是稳定性方面都要优于不纳入行业因子的选股模型,基于Logistic回归的Barra因子选股模型无论在模型的收益性还是稳定性方面都要优于基于线性回归的Barra因子选股模型,基于Logistic回归的Barra因子选股模型选股能力相对较优。基于Logistic回归的Barra因子选股模型也存在着一定的局限性。一方面由于Logistic回归模型中被解释变量与解释变量并非一一对应的关系,无法进一步研究分析单个因子对收益率的贡献度,从而无法准确地对收益率进行归因分析。另一方面模型配置了一些反映短期市场情绪的技术面因子,此举虽然能够能灵活地捕捉市场异常,但频繁地交易也增加了策略的成本以及策略的波动率和下行风险,如何进一步地分析模型收益的具体来源以及降低策略的波动率和下行风险有待后续的研究与分析。