基于随机森林的指数化投资组合构建研究

被引量 : 0次 | 上传用户:crazyinlove_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指数化投资,是指在相对成熟的证券市场当中,人们通过购买全部或者部分某指数成分股进行指数复制和追踪,在充分分散化风险和被动式管理的基础上,将交易成本降至最低以期获得市场平均收益的投资模式。从2002年我国第一只开放式指数基金出现以来,指数基金在我国的发展迅速。2015年,我国第一只股票期权——上证50ETF期权在上海证券交易所开始交易,指数基金的发展进入新的阶段。指数化投资组合的构建方法中,分层抽样的构建方法是以分析目标证券市场的市场结构为基础,选择最具代表性的指数成分股来拟合目标指数。本文扩展了随机森林的应用,将随机森林方法应用到指数化投资的成分股选择中,丰富了分层抽样的构建方法,并对其进行了适用性研究。具体而言,首先研究了随机森林在指数化投资组合构建流程的第一步——选股的适用性,本文选取上证50指数为基准指数,采用随机森林模型对各个指数成分股的重要性进行计算,选出相对重要的10只成分股,进而分析这10只股票在指数样本股中特征来解释随机森林在选股上的适用性;其次,研究了构建指数化投资组合构建流程的第二步——成分股权重分配,本文选后运用基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型完成了成分股的权重分配,通过绩效分析,比较了随机森林和其他分层抽样方法在不同资金配置模型上的表现,得出随机森林在整个指数化投资组合构建中的适用性。通过模型验证得出主要结论:(1)利用随机森林理论选出的成分股,在市值占比和行业种类上都比较多,在拟合指数走势上有较好的适用性;(2)相比于最大权重抽样法、最大相关系数法,行业分层抽样法和聚类分层抽样法,随机森林所构建的指数化投资组合的绩效表现相对较好;(3)在各种资金配置模型中,基于随机森林的MAD模型跟踪绩效相对较好;(4)在随机森林的基础上,通过对比基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型,前者的跟踪误差小于后者,有着更好地拟合效果;但同时,后者的绩效表现更好;在再平衡测试中,不追求较低的跟踪误差使得后者的再平衡成本和交易量都较低。
其他文献
述补结构是汉语语法体系中一种重要的结构,它的产生和发展影响了现代汉语语法系统的形成。述补结构也是汉语中很特别的一种结构,在与其它语言的比较研究中,也是值得重视的。
目的:基于腺病毒载体介导的RNAi在体阻断PD-1在类风湿性关节炎(Rheumatoid arthritis,RA)大鼠模型的表达,研究艾灸对实验性RA大鼠TCR信号通路上Lck、Fyn激酶的影响及其PD-1调
<正> 求动点的轨迹是解析几何的一个基本问题.轨迹的概念包含“完备性”与“纯粹性”两方面的要求,因解题不慎致使动点轨迹出现“遗漏”和“不纯”的现象.本文列举若干典型错
“把”字句是汉语的独有句式,也是语法学界高度关注的课题。关于“把”字句的研究,上可追溯至1924年,至今历经80余年。在研究中,众多学者对“把”字句中的谓语动词不能是一个
本文通过对目前流行的各种基元反应定义的分析和比较,提出一个较确切的基元反应的新定义;同时还对基元反应与基元过程进行了区分。
在实际应用中人们经常遇到多目标优化问题,如投资问题。投资者一般希望所投入的资金量最少,风险最小,且获得的收益最大。由于多目标优化问题的多个目标通常是相互冲突的,对其中一
宋代笔记小说《罗湖野录》,作为笔记体之佛门见闻录,采录了很多当时的碑刻等第一手材料,其中保留了北宋禅宗发展的重要史料。本文通过对《罗湖野录》的成书情况和背景叙述以
当今世界,旅游业已成为最大的产业之一。随着世界经济的发展和文化交流的扩大,旅游业中的国际旅游已占有非常重要的地位。中国作为世界上最受游客青睐的旅游目的地之一,外国
低碳一词来源于低碳经济,一般来说研究低碳建筑的思路是保证不降低的建筑使用功能性、舒适性前提下减少运营能耗负荷,研究多集中在设备、材料、技术等建设环节的末端,缺乏建
2015年是中国和泰国建交40周年,中国和泰国的贸易合作有着长期的历史关系,可以追溯到很远,而今中国亦然变成了泰国第一贸易来往巨头,合作方面十分丰富,不管进口还是出口基本