论文部分内容阅读
近年来,私募证券投资基金行业不断蓬勃发展,尤其是自2015年以来,私募证券投资基金行业整体规模得到了快速扩张。由于其信息披露不规范、数据获取难度大等原因,对私募证券投资基金的研究相对较少,随着私募市场快速发展,私募证券投资基金的投资策略也逐渐多元化,不同策略的私募证券投资基金的特征不同,这为投资者选择私募证券投资基金带来一定的挑战。在此背景下研究私募证券投资基金收益率的预测和选择,可以帮助投资者树立投资信心,为其更好地选择私募证券投资基金提供一定的依据,也为监管机构制定监管政策提供一定的借鉴。
在目前的研究中,多集中于构建私募证券投资基金的业绩评价因子对其进行评价,亦或是通过结合这些因子形成私募证券投资基金的综合评级,且这些因子均是基于私募证券投资基金的历史业绩得到,然而这些基于历史数据得到的风险因子是否对其未来的收益具有持续性影响是需要研究的重要问题。如果基于历史数据得到的风险因子对私募证券投资基金未来的业绩没有持续的影响,那么投资者就无法依据这些评价因子对私募证券投资基金做出选择。因此,基于历史业绩的评价因子能否成为指导投资的依据,这些因子对私募证券投资基金未来的收益是否具有预测性是我们关心的重要问题。
由于私募证券投资基金信息披露有限,本文以可获取的私募证券投资基金的收益率信息,构建了描述基金收益率特征的风险因子,来研究描述私募证券投资基金收益率的风险因子是否对其未来的收益率具有预测性。由于机器学习的方法不强调模型的结构,通常不需要先验的统计假设,因此本文在多因子模型的基础上构建了有监督的机器学习模型,根据预测排名结果将私募证券投资基金等分为十组,构成十个等权重的基金组合,通过观测基金组合真实收益的排名来观察预测模型的有效性。本文用线性、非线性、模型收缩、模型平均多种机器学习方法分别做了分析,以减少模型设定可能带来的偏误。
由于不同策略私募证券投资基金的投资标的和投资依据不同,因此本文对不同策略的私募证券投资基金分别做了分析。对于同种策略的私募证券投资基金,用不同的机器学习方法分别结合三个月、六个月、十二个月的预测窗口期,进行滚动预测,来模拟私募证券投资基金最常用的封闭期,并将Avramov、Barras和Kosowski(2013)提出的宏观因子预测模型作为基准比较模型;依据预测结果选择私募证券投资基金组合,并将基金组合的表现与相应策略的市场指数的表现进行了比较。论文的最后用随机森林机器学习方法对风险因子贡献度进行了统计分析,并将基金组合收益率时间序列与主要市场指数间的收益率时间序列的关系进行了分析,以进一步验证依据预测结果选择基金组合的有效性。
本文得出的主要结论有:(1)对于特定策略的私募证券投资基金,描述其收益率特征的风险因子对其未来累积收益率有一定的预测性。(2)不同策略的私募证券投资基金,描述其收益率特征的风险因子对其未来累积收益率的可预测窗口期不同。(3)在描述私募证券投资基金收益率的特征因子中,私募证券投资基金过去一段时间的收益率对其未来累积收益率的贡献度最高。(4)模型收缩、模型平均、对因子进行非线性运算的机器学习方法的预测效果更好,所选择的基金组合的表现更优。(5)基于收益率特征因子的预测结果可以在一定程度上指导投资,所选择的基金组合的超额收益来源于模型本身而非市场。
本文研究的创新点主要包括:(1)分析描述私募证券投资基金收益率因子对其未来累积收益率的可预测性,可以更好的指导投资。(2)对不同投资策略的私募证券投资基金分别进行了研究分析,研究结果更加详尽与精确。(3)用多种机器学习方法来训练私募证券投资基金数据,减弱模型设定偏误所带来的影响。
论文的不足之处主要体现在:(1)论文主要集中在预测基金未来累积收益率而没有考量其风险。(2)依据收益率预测结果对私募证券投资基金进行排名,而没有考量收益的具体值及市场整体表现。(3)由于私募证券投资基金信息获取难度大,只选取了描述基金收益率特征的风险因子进行了分析,分析不够全面。
在目前的研究中,多集中于构建私募证券投资基金的业绩评价因子对其进行评价,亦或是通过结合这些因子形成私募证券投资基金的综合评级,且这些因子均是基于私募证券投资基金的历史业绩得到,然而这些基于历史数据得到的风险因子是否对其未来的收益具有持续性影响是需要研究的重要问题。如果基于历史数据得到的风险因子对私募证券投资基金未来的业绩没有持续的影响,那么投资者就无法依据这些评价因子对私募证券投资基金做出选择。因此,基于历史业绩的评价因子能否成为指导投资的依据,这些因子对私募证券投资基金未来的收益是否具有预测性是我们关心的重要问题。
由于私募证券投资基金信息披露有限,本文以可获取的私募证券投资基金的收益率信息,构建了描述基金收益率特征的风险因子,来研究描述私募证券投资基金收益率的风险因子是否对其未来的收益率具有预测性。由于机器学习的方法不强调模型的结构,通常不需要先验的统计假设,因此本文在多因子模型的基础上构建了有监督的机器学习模型,根据预测排名结果将私募证券投资基金等分为十组,构成十个等权重的基金组合,通过观测基金组合真实收益的排名来观察预测模型的有效性。本文用线性、非线性、模型收缩、模型平均多种机器学习方法分别做了分析,以减少模型设定可能带来的偏误。
由于不同策略私募证券投资基金的投资标的和投资依据不同,因此本文对不同策略的私募证券投资基金分别做了分析。对于同种策略的私募证券投资基金,用不同的机器学习方法分别结合三个月、六个月、十二个月的预测窗口期,进行滚动预测,来模拟私募证券投资基金最常用的封闭期,并将Avramov、Barras和Kosowski(2013)提出的宏观因子预测模型作为基准比较模型;依据预测结果选择私募证券投资基金组合,并将基金组合的表现与相应策略的市场指数的表现进行了比较。论文的最后用随机森林机器学习方法对风险因子贡献度进行了统计分析,并将基金组合收益率时间序列与主要市场指数间的收益率时间序列的关系进行了分析,以进一步验证依据预测结果选择基金组合的有效性。
本文得出的主要结论有:(1)对于特定策略的私募证券投资基金,描述其收益率特征的风险因子对其未来累积收益率有一定的预测性。(2)不同策略的私募证券投资基金,描述其收益率特征的风险因子对其未来累积收益率的可预测窗口期不同。(3)在描述私募证券投资基金收益率的特征因子中,私募证券投资基金过去一段时间的收益率对其未来累积收益率的贡献度最高。(4)模型收缩、模型平均、对因子进行非线性运算的机器学习方法的预测效果更好,所选择的基金组合的表现更优。(5)基于收益率特征因子的预测结果可以在一定程度上指导投资,所选择的基金组合的超额收益来源于模型本身而非市场。
本文研究的创新点主要包括:(1)分析描述私募证券投资基金收益率因子对其未来累积收益率的可预测性,可以更好的指导投资。(2)对不同投资策略的私募证券投资基金分别进行了研究分析,研究结果更加详尽与精确。(3)用多种机器学习方法来训练私募证券投资基金数据,减弱模型设定偏误所带来的影响。
论文的不足之处主要体现在:(1)论文主要集中在预测基金未来累积收益率而没有考量其风险。(2)依据收益率预测结果对私募证券投资基金进行排名,而没有考量收益的具体值及市场整体表现。(3)由于私募证券投资基金信息获取难度大,只选取了描述基金收益率特征的风险因子进行了分析,分析不够全面。