基于机器学习模型融合的中证800指数增强量化策略设计

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:fly57384
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中国A股市场环境愈发成熟、政策法规愈发完善、投资者的参与程度以及专业化程度愈发提高的背景之下,对于证券市场的理论和实践研究在一直深入。各种投资策略层出不穷,这其中指数增强策略凭借着其可以在保障跟踪指数所获得的基本收益率的情况下获得超额收益率的优势,同时满足了投资者对风险控制和追逐高收益两方面的需求。指数增强策略的核心是进行个股选择挖掘出具有超额Alpha收益的优质资产。传统的因子选股模型在大数据技术及计算机技术快速发展背景下受到多因子量化选股模型的理论及实践冲击。本文正是基于此时代背景使用机器学习模型融合策略对多因子量化选股模型进行设计,以谋求对指数增强策略优化的目的。为更全面研究中国A股市场大中小不同市值个股的选择,本文指数增强策略选择的指数标的为中证800。本文充分利用机器学习技术优势,一方面在多因子量化选股模型算法的选取上,使用XGBoost和LightGBM两种机器学习树模型构建基础学习器;另一方面使用Stacking方式对基础学习器进行融合以获得更强的模型融合强学习器;此外还对机器学习算法经模型融合前后的效果表现进行了对比分析。在对训练样本的选取上,本文聚焦对个股影响因素更大的风格因子,全面考虑了传统因子、技术因子、另类因子,选取了12大类共计89个因子作为个股特征纳入机器学习样本训练。训练方案为二分类学习训练,对个股标记的0或者1意味着对个股的选择与否,在训练标签的选取上,对超额收益率、累计收益率、夏普比率三个标签进行分别训练回测,证明以超额收益率作为学习标签对谋求超额alpha收益效果最明显。同时本文依据梯度提升树模型在训练提升时对因子重要度赋予的权重不同进行因子评价,一方面通过因子评价构建因子择时策略对因子进行筛选以对模型回测结果进行进一步优化;另一方面根据因子重要度评价对因子进行分析,分析结果为多因子量化模型在A股市场的应用提供借鉴意义。关于模型融合策略优化,本文首先对机器学习模型融合算法进行参数调整以获取最优精度的超参数,其次对经过优化后的模型由等权重持仓策略改变为市值权重持仓策略,发现市值因素在2017年至2020年期间对A股个股收益率有着极为明显的影响。本文经过指数增强策略设计、模型训练回测及优化、模型和因子重要度分析等多个环节研究,得出结论如下:1.基于机器学习算法的多因子量化选股模型相较于传统多因子选股模型有较大的可能性空间。充分结合选股模型应用场景选取适当的机器学习算法搭建模型可对多因子选股模型的预测效果进行明显的提升,达到指数增强效果。2.由于机器学习算法本身应用广泛差异较大,通过设计合理的模型融合策略可以更大发挥机器学习算法的预测优势。但同质化较高的基学习器在较为平行的融合策略下提升效果有限。3.在多因子选股模型学习训练中,通过合理的方式选择因子择时策略先对样本特征进行一轮筛选,再将筛选之后的因子纳入到正式的样本训练中可以获得更加出色的模型表现。4.对强学习器进行参数优化为其带来的预测效果提升可能有限,但可通过纳入更多的基学习器或设计更为复杂的模型融合结构来对预测效果进行提升。同时不同的市场状态以及持仓权重的不同均会影响模型训练效果。5.不同因子特征对与个股收益率的影响是不同的,同一因子在不同的时期也会有着不一样的表现,但因子自身表现是否出色具有相对稳定性。基于本文的研究分析及所得结论,以及共同富裕的时代背景下公民对财富管理愈发强烈的需求,本文提出:应深化中国证券市场的发展、丰富指数增强策略的设计研究、促进多因子选股模型理论研究与量化投资技术的结合应用、加深机器学习的理论研究和在金融领域的应用等倡议。
其他文献
目前,房地产行业蓬勃发展时期已然过去,利润空间不断缩小,同时国家针对房地产行业风险问题颁布了“三道红线”等宏观调控政策,加之新冠疫情等不确定性事件的发生,导致房地产行业的生存环境变得恶劣,特别是对于处于行业劣势地位的中小房地产企业来说,这些中小房地产企业处于快速扩张期,在“三道红线”政策的约束下,在投资扩张过程中如何保证自身的盈利性,同时控制风险,并且不违规踩到三道红线,是中小房地产企业迫切需要解
学位
在“健康中国”国家战略的实施背景下,我国众多医疗服务企业为占据更多市场份额,通过一系列的并购交易迅速实现了自身规模的扩张。企业在连续并购的扩张过程中,往往会由于并购频率高、整体规模大更易产生资产管理难度升高、融资结构不合理以及并购整合效率低等问题,进而诱发和提升企业的财务风险。美年健康自2015年借壳上市以来,借助连续并购的扩张方式,逐渐发展成为民营体检行业的龙头企业,在医疗服务行业中有较强的代表
学位
商业银行为我国金融系统的重要组成部分,银行业规模庞大、复杂程度高、关联性强,在金融体系中具备重要影响力,一旦出现风险问题,很可能迅速传染,导致整个金融体系的坍塌。近年来我国银行的流动性创造水平不断上升,但也有“资产荒”、“负债荒”等事件的出现,影响我国的实体经济。更多地关注流动性创造这一指标对于调控我国金融系统性风险是非常必要的,本文侧重于通过实证方法测度银行流动性创造这一指标对我国银行业系统性风
学位
量化投资在国外已经有几十年的发展历史,相比于主观投资来讲,量化投资业绩稳定,市场的交易规模和份额不断扩大,在市场中越来越受投资者的关注。在量化领域中,针对商品期货的量化投资策略(CTA策略~1)逐渐成为主流的投资方式。本文基于商品期货投资策略相关理论和机器学习理论,运用实证研究和对比分析的方法,采集期货市场上全部主力合约行情数据进行复权拼接,选取近一年成交金额排名前20的期货品种,运用VNPY开源
学位
世界各国的经济在快速发展的过程中消耗了大量的自然资源,使得生态环境遭到了严重破坏。我国作为人类命运共同体中的重要一员,深知保护环境的重要性,因此一直践行着绿色发展理念。2021年3月通过的国家十四五规划中明确指出了我国力争于2030年达到碳达峰和2060年达到碳中和的美好愿景,习近平总书记也多次在重要会议上指出了我国的碳中和目标。在我国努力实现碳中和目标的过程中,绿色金融起到了重要作用。同时绿色资
学位
定向可转债是一种新型并购支付工具,兼具股债双性。上市公司发行定向可转债进行并购支付时,标的方可相机行事,若上市公司股价一路向好,则选择转股以赚取资本利得,若上市公司股价一路走跌,也可行使债权人权利,到期兑付本息以规避风险,从而打消标的方的担忧,提升并购方案的弹性,提高谈判效率。截至2021年,A股市场中已有27家上市公司发布并购重组预案,表示将使用定向可转债作为本次并购支付工具。证监会表示,将积极
学位
长租公寓企业普遍采用租金贷这一金融产品进行融资,在租房需求不断增加的前提下,长租公寓企业通过运用租金贷所获得的资金近几年来实现快速发展。但规模不断扩大的同时,其财务风险不断上升,资金链断裂情况屡屡发生。2020年下半年,作为届时长租公寓行业规模前二的蛋壳公寓出现资金链断裂,产生恶劣的社会影响,根据年报公开信息,其租金贷融得的资金占收入的比重高达90%,在未来租金贷融资受限的背景下,如何对租金贷的使
学位
在我国经济不断向好的环境大背景下,居民对于购房的需求也逐渐上升,随之而来我国的居民个人住房抵押贷款迅速增加,银行的负债期限结构不匹配带来的资金流动性不足等问题逐渐显现出来。为了提高资源配置效率,降低商业银行面临的风险,2005年建设银行开启住房抵押贷款资产支持证券第一轮试点,发行了“建元2005-1”,成为我国第一个个人住房抵押贷款证券化产品,成功将银行间大额存量资产盘活,调整了银行资产结构。20
学位
2013年以来,随着混合所有制改革的不断深化,国有企业不断通过引入民间资本来注入新鲜血液。从2018年起,我国去杠杆政策稳步推进、经济下行压力不断加大,民营企业股权质押平仓、债务暴雷事件层出不穷,混合所有制改革也成为民营企业解决融资约束的一种选择。这种选择在环保类企业中展现的尤为突出,在2018年至2021年这几年的时间里,中国环境企业20强榜单中仅仅只剩2家民企还未参与混改。总的来说,企业混改对
学位
伴随着中国经济的高速增长,中国的财富管理市场迎来了一段黄金时期。截止2020年中国个人持有的可投资资产总体规模达241万亿元,居民财富管理需求日益凸显。面对国内外经济环境不确定性增强和中国财富市场竞争加剧的局面,商业银行积极探财富管理业务的发展模式,以提升财富管理业务效益。本文旨在探索商业银行智慧金融在财富管理业务中的应用和经济效益。采用实证分析和案例分析相结合的方式,以行业大数据分析为案例研究提
学位