基于XGBoost和LightGBM算法的多因子选股方案设计

来源 :南京大学 | 被引量 : 0次 | 上传用户:n4fc561v4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着计算机技术的迅速发展,量化投资在神州大地上方兴未艾。一般意义上的量化投资包含量化选股和择时、资产配置和算法交易等方面。相较于以基本面分析和技术分析为代表的传统选股方法,量化选股相对更加客观,具有不易受主观情绪影响的优点。以集成学习方法为代表的机器学习方法也在资本市场上得到了有效应用。微观层面,将前沿的机器学习算法应用于证券投资,构建能有效提高投资效率、提升投资收益率的选股模型,研究对模型贡献度较大的具体因子,在理论和实务两方面都具有较大的研究意义。宏观层面,对量化选股方法的深入研究,有助于拓宽投资者投资渠道、提高资本市场定价机制和完善资本市场机制建设。XGBoost模型和LightGBM模型均属于集成学习模型,在解决分类问题时具有效率快、准确率高和分类过程易可视化等优点。本文从分类问题的视角看待选股问题,并对XGBoost模型和LightGBM模型的选股能力进行了系统性研究。首先通过网格搜索法确定最优参数,并对确定的参数进行参数优化;然后通过年度和月度滚动测试对XGBoost模型和LightGBM模型的模型有效性、决策树结构和因子重要性进行对比分析;之后利用行业中性选股策略对XGBoost模型和LightGBM模型在量化选股领域的有效性进行深度探究;最后在行业中性选股的框架下进行包括LightGBM、XGBoost、GBDT、Ada Boost和随机森林等5种不同的集成学习模型的单因子测试,比较5种模型的时间和准确率两方面的差异。本文利用从2008年1月31日至2019年7月31日的所有A股股票共10个大类423个因子的月频数据和相应的月收益率数据进行建模分析,研究发现:(1)XGBoost和LightGBM分类模型具备不错的预测能力,且LightGBM分类模型预测能力强于XGBoost;(2)XGBoost和LightGBM分类模型具有较多参数,但只有较少参数能显著提高模型分类能力,其他参数可设置为默认值。(3)LightGBM、XGBoost、GBDT、Ada Boost和随机森林等集成学习模型均具有较好的选股能力,LightGBM和XGBoost的选股能力优于其他集成学习模型。(4)LightGBM和XGBoost分类模型应用于量化选股时运行速度快于GBDT、Ada Boost和随机森林等其他集成学习模型,且LightGBM模型的运行速度快于XGBoost。(5)Mkt Value(市值)、GREC(分析师推荐评级变化趋势)因子和DAREC(分析师推荐评级变化)等因子对股价收益率具有较大影响。2017年之前市场上重要性最大的因子是Mkt Value,其重要性在之后月度下降迅速。
其他文献
AMP-18是一种新发现的由胃腺体上皮细胞合成的小分子蛋白质,独特表达于胃黏膜。机体其他部位少见,胃癌组织中表达缺失.AMP-18由185个氨基酸组成。除去N端信号肽(20个氨基酸)后大小
目前的激光雷达系统,通常采用机械光束偏转技术,它能够实现大视场、高功率光束扫描。但存在体积庞大、系统复杂、扫描速度慢、不可随机指向等缺点。近年来,随着微光学器件基
本文分析了农业"生产主义"和"后生产主义"的特征,并在观念和政策层面对其进行了比较。在此视角下,文章对天津市北辰区双口镇在发展过程中遇到的"生产主义"困境进行了剖析,提
目的:探讨皮瓣在面部瘢痕的美容修复中的应用技术。方法:2009年9月~2011年5月,应用局部皮瓣、岛状皮瓣、面部扩张皮瓣、胸三角扩张皮瓣带蒂移植及扩张的胸三角皮瓣、前臂皮瓣
会议
偶氮染料由于具有良好的色牢度、鲜艳的色彩、易于印染和安全无毒的特性,逐渐成为纤维用染料的主流。目前工业生产中通常使用搅拌釜式反应器(Stirred tank reactor,STR)通过
【正】我接触张伟俊时,已经是这次全球竞聘的最后一轮。当时的候选人有五个,三个海归派,两个国内背景的,都是实力相当强的。
随着基础设施建设的不断完善,逢山开路,遇水架桥的理念已经成为共识。越来越多的桥梁需要跨越山地、河流、峡谷等复杂地形,桥梁跨度与施工技术难度也越来越大。桥梁转体技术
党的十八大提出要实施创新驱动发展战略,十八届五中全会强调要树立创新、协调、绿色、开放、共享五大发展理念,创新理念位居其首。在国际竞争日益激烈和我国进入经济新常态的
采用自编运动员运动决策风险问题问卷,以天津女排队运动员为研究对象,探讨正负信息呈现方式对运动员参照点的选取及运动决策风险偏好的影响,通过对被试选择方案进行X2检验,结
气体绝缘金属全封闭组合电器(GIS)在电网中是主要的开关设备,在特高压电网中更是重要的高压电器装置。GIS设备由于其配置方便、体积较小、运行可靠且使用寿命长等优点,在电力系统中得到普遍应用。但是,在GIS设备大范围以及长期使用中,由GIS引发的变电站事故逐渐增加,对电网的稳定运行造成了严重的影响。因此,如何对GIS设备内部状态进行直观检测,做到“防患于未然”,是电网运维领域研究热点之一。目前,X射