论文部分内容阅读
Markowitz(1952)提出的均值-方差投资组合模型,改变了传统的纯粹描述性研究和单凭经验分析以及管理投资组合的状态,为量化资产组合收益和风险以及配置最优投资组合提供了坚实的理论基础,开创了现代投资组合理论的先河,对金融领域的理论、实证以及实践研究产生了极为深远的影响。然而大量研究已经表明,在投资者偏好为非二次和(或)资产收益率非正态条件下基于均值-方差模型构建的投资组合权重往往不是最优,因而会存在较为严重的福利损失。因此,面对金融风险资产非对称性、尖峰和厚尾等高阶矩特征的客观存在,投资者在进行投资组合优化时有必要考虑资产收益率中高阶矩带来的影响,否则在投资组合优化过程中便会产生次优决策。目前,基于高阶矩建模及其投资组合优化研究已经得到了国内外学者的广泛关注。大体来看,已有关于高阶矩方面的研究或者采用直接法将投资组合收益率各阶矩构成的函数作为目标函数直接进行优化,从而形成均值-方差-偏度或均值-方差-偏度-峰度投资组合优化问题,或者采用间接法通过对期望效用进行高阶泰勒级数展开,通过最大化期望效用函数来进行间接近似求解。上述方法中无论采用直接法还是间接法均不可避免地需要估计各阶矩矩阵,而在资产个数较多时,协偏度和协峰度计算中组合多样性的存在使得“维数灾难”成为高阶矩投资组合优化时面临的主要难题之一。为了解决高阶矩估计中严重的抽样误差问题,一种较为直接方法是增加可观测样本,但考虑到中国金融市场起步较晚,可供使用的低频观测数据不足,因而在实际应用中存在现实上的困难。另一种方法是通过假定收益率服从某一特定的数据生成过程从而对各阶矩矩阵施加结构化约束,如因子模型等方法。该方法以增加模型设定错误风险为代价大大减少了待估参数的个数,显著降低了各阶矩矩阵中元素的抽样误差,从而在高维矩阵估计中被当做主要手段。进一步地,在估计各阶矩时因子模型的选择和设定上,多数学者往往采用单因子模型或利用主成分分析方法得到的统计因子构建因子模型。这两种方法或者没有在理论上对特定条件下资产收益率的真实数据生成过程合理性进行理论上的研究,或者基于协方差矩阵分解方法而忽略了更高阶矩矩阵中所隐含的信息,从而无法对各阶矩矩阵做出更加准确的估计。本文在结合前人已有研究的基础上,基于混频因子模型方法,通过更高频率数据的使用使得模型中包含更多的历史信息以及增加因子个数提高对收益率的解释能力两种途径,力图解决高阶矩估计面临的“维数灾难”问题,同时进一步提高高阶矩投资组合的表现。具体来看,本文的主要研究内容如下:第一,本文提出了基于混频多因子模型高阶矩建模时最优因子个数识别的方法和策略。在假定收益率服从混频多因子模型的条件下,由其得到的扰动项应具有独立同分布(i.i.d)特征,进而由此扰动项构造得到的各阶矩矩阵应具有显著的稀疏性。基于这一假定,得到了模型在设定适当条件下高阶矩真实分布和使用样本估计得到的已估高阶矩的渐近分布,从而保证了可以通过对扰动项构建的高阶矩矩阵稀疏性检验来判断因子模型设定的合理性并进行统计推断,从而识别出包含高阶矩矩阵时的最优因子个数。在具体统计量构建上,本文分别提出了参数的Wald检验和非参数的Gumbel检验两种统计检验方法。最后,通过使用大量的蒙特卡洛模拟检验了有限样本条件下两种统计检验方法在不同维数下对最优因子个数识别能力的检验水平和检验功效。第二,为了提高因子模型对于资产收益率的解释能力,进而提高包含高阶矩的投资组合表现,本文提出使用混频版本的Fama-French多因子模型来估计各阶矩矩阵。在混频模型的选择上,使用了Ghysels,Santa-Clara和Valkanov(2004)提出的混频数据抽样(MIDAS)模型,该模型假定用作解释变量的实际可观测数据抽样频率不低于被解释变量对应的观测数据抽样频率,从而在股票收益率观测样本受限的条件下通过利用频率较高的因子中包含的信息提高对收益率的解释能力,降低各阶矩矩阵中元素的抽样误差。在MIDAS模型设定方面,根据对待估参数是否施加函数性约束分为无约束混频数据抽样(U-MIDAS)模型和有约束混频数据抽样(R-MIDAS)模型。由于随着高频解释变量相对于低频被解释变量抽取样本频率倍差的增大、滞后阶数的增加以及更多高频因子变量的使用,U-MIDAS模型中会由于存在大量的待估参数使得降低各阶矩矩阵中元素抽样误差的目的失去意义,相比之下RMIDAS通过使用参数较少但较为灵活的函数形式对待估参数进行了约束,在保证模型解释能力的同时避免了待估参数的快速增加,因此本文将重点考虑对参数施加函数约束的R-MIDAS模型,并将其应用于后续的高阶矩投资组合建模及其风险评价中。第三,使用中国A股市场上市公司数据为例,从统计意义和经济价值两个方面将混频多因子模型建立的高阶矩估计方法与其他现有高阶矩估计方法在投资组合上进行了多方面的比较。在假定投资者具有常相对风险厌恶(CRRA)系数不变的条件下,使用CRRA型效用函数并将其使用泰勒级数展开到四阶,通过运用全局优化算法以获得不同高阶矩估计方法得到的最优投资组合权重。为了从统计意义上判断混频多因子高阶矩建模的有用性,本文使用货币效用收益(MUG)作为衡量标准,从A股市场中随机抽取一揽子股票构建最优投资组合并将其方法重复进行100次以获得各个方法的MUG描述统计结果。另外,考虑到相对风险厌恶系数的变化、估计高阶矩矩阵时实际使用的可观测样本长度以随机抽取一揽子股票构建投资组合可能存在幸存者偏误等问题,从而对高阶矩投资组合表现可能产生的影响,大量的稳健性检验对这些问题进行了一一验证。为了从经济价值上判断混频多因子高阶矩建模的实际价值,使用考虑了资产收益率高阶矩特征的修正期望损失(mES)作为衡量投资组合下行风险的标准,并随机地从A股市场抽取一揽子股票为例,对混频多因子模型以及其他高阶矩估计方法的经济价值进行了评价。本文的主要创新点主要体现在以下三个方面:(1)针对高阶矩估计中面临的“维数灾难”问题提出了一种可以有效降低抽样误差的估计方法。在第4章中,通过假定数据生成过程来自无约束混频数据抽样模型和有约束混频数据抽样模型,各阶矩矩阵中由于结构化约束的存在大大减少了待估参数的个数,虽然该方法可能有模型设定错误的风险,但本文第5章研究结果表明在模型设定适当的条件下,结构化约束可以显著减少各阶矩矩阵中元素的估计误差,使用本文提出的混频因子模型可以很好地提高包含高阶矩的投资组合表现。(2)对于采用多因子模型进行高阶矩建模时如何选择最优因子个数问题提出了一种基于扰动项构建的最优因子个数识别方法。之前已有研究大多基于高维协方差矩阵,而针对维数更高的如协偏度矩阵和协峰度矩阵最优因子个数选择问题并未有相关文献对其进行深入的探讨。在第4章中,给出了混频因子模型最优因子个数筛选策略。通过在多因子模型高阶矩建模中选择适当的因子个数,使得模型在解释能力和精简性上做出了最优的权衡,从而在保证降低高阶矩矩阵估计误差的同时减少模型设定错误的可能,进一步提高高阶矩矩阵的估计精度,为构建稳健和精确的高阶矩投资组合并进行风险度量提供坚实的基础。(3)通过基于期望效用函数的四阶泰勒级数展开,将由MIDAS模型估计得到的高阶矩矩阵引入到投资组合中,从而构建高阶矩投资组合策略,通过与其它结构化高阶矩建模方法多方面、细致的比较发现该模型在投资组合建模方面具有十分良好的经济价值。在4章和第5章中,在因子选择上使用了基于基本面构建的因子数据。通过采用混频多因子模型估计高阶矩矩阵,不仅可以充分利用影响股票收益因素中的历史信息,同时还能有效降低待估参数个数,从而避免“维数灾难”问题,因此在高阶矩投资组合建模中拥有着十分广阔的应用前景。