论文部分内容阅读
指数化投资,是指在相对成熟的证券市场当中,人们通过购买全部或者部分某指数成分股进行指数复制和追踪,在充分分散化风险和被动式管理的基础上,将交易成本降至最低以期获得市场平均收益的投资模式。从2002年我国第一只开放式指数基金出现以来,指数基金在我国的发展迅速。2015年,我国第一只股票期权——上证50ETF期权在上海证券交易所开始交易,指数基金的发展进入新的阶段。指数化投资组合的构建方法中,分层抽样的构建方法是以分析目标证券市场的市场结构为基础,选择最具代表性的指数成分股来拟合目标指数。本文扩展了随机森林的应用,将随机森林方法应用到指数化投资的成分股选择中,丰富了分层抽样的构建方法,并对其进行了适用性研究。具体而言,首先研究了随机森林在指数化投资组合构建流程的第一步——选股的适用性,本文选取上证50指数为基准指数,采用随机森林模型对各个指数成分股的重要性进行计算,选出相对重要的10只成分股,进而分析这10只股票在指数样本股中特征来解释随机森林在选股上的适用性;其次,研究了构建指数化投资组合构建流程的第二步——成分股权重分配,本文选后运用基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型完成了成分股的权重分配,通过绩效分析,比较了随机森林和其他分层抽样方法在不同资金配置模型上的表现,得出随机森林在整个指数化投资组合构建中的适用性。通过模型验证得出主要结论:(1)利用随机森林理论选出的成分股,在市值占比和行业种类上都比较多,在拟合指数走势上有较好的适用性;(2)相比于最大权重抽样法、最大相关系数法,行业分层抽样法和聚类分层抽样法,随机森林所构建的指数化投资组合的绩效表现相对较好;(3)在各种资金配置模型中,基于随机森林的MAD模型跟踪绩效相对较好;(4)在随机森林的基础上,通过对比基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型,前者的跟踪误差小于后者,有着更好地拟合效果;但同时,后者的绩效表现更好;在再平衡测试中,不追求较低的跟踪误差使得后者的再平衡成本和交易量都较低。