基于机器学习CART算法的股票投资策略的研究

被引量 : 1次 | 上传用户:DGFIDYRSTG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展以及资本市场的成熟,股票投资逐渐受到越来越多的投资者的关注。而传统的股票分析方式受限于投资者有限的精力和认知水平,同时也会受到非理性心理和情绪的影响。相对而言,量化投资以数量化的方式,使用计算机程序自动发出投资指令,往往能够实现较为稳定的收益。本文将采用量化投资方式并结合机器学习CART(Classification and Regression Tree)算法对股票的收益情况进行预测,构建能够跑赢大盘的量化选股策略。首先经过对比分析后,本文选择综合指标的量化投资策略,即在备选特征因子的选取上兼顾基本面分析指标和技术分析指标。经一系列数据处理和因子过滤工作后,最终选择ROE增长率等六个指标作为建模特征因子,且以样本股月收益率是否超过样本月收益率的中位数来作为分类目标变量。之后,本文以沪深300指数成分股为实证对象,使用CART算法构建静态分类树模型,并在静态树的基础上逐月进化形成滚动分类树模型,且期间对分类树进行剪枝以缓解过拟合问题。分类树生成后,两模型均按照分类目标变量的预测对股票实现分类,构建投资组合。使用历史数据分别对两模型进行回测和比较分析。结果表明CART滚动分类树的建模方式更为有效,表现为其策略评价指标较好,两组股票收益情况的区分度较高,且同基于同样的数据集构建的C4.5算法和随机森林算法下的滚动分类树模型相比表现较优。最后以CART滚动分类树模型为基础,结合了中国现实的交易制度和交易规则进行回测分析,并与传统基金行业业绩进行了对比,论证了该算法在现实应用中的有效性。本文的研究仍然存在一些不足之处。对决策树算法而言,特征因子的选取尤为重要,所以未来还需要在特征因子的选择上付出更大的努力,在保证模型泛化能力的同时尽可能考虑更全面的因素。
其他文献
随着老漂族的规模不断壮大,其社会适应的问题日益突出。在老漂族的相关研究基础上,以上海市松江区某小区老漂族为研究样本,通过问卷调查了解老漂族的社会适应现状。经过调查发现,老漂族经济适应、社会适应、文化生活适应等方面处于较低水平。基于此,在积极老龄化理念背景下,从构建兜底线保障服务体系、提供积极的社会参与平台和优化老年健康资源供给等三个方面提出策略建议。
期刊
自2019年末至今,在全球范围内迅速蔓延的“2019冠状病毒病(COVID-19)”已造成数以亿计的人员感染、伤亡和社会经济损失。单一学科的研究无法快速有效地分析和防控新型传染病,因此,交叉学科逐步成为科研热点。分数阶微积分作为整数阶微积分的自然延伸,分数阶理论已逐步得到数学、物理学、经济学、生物医学等领域专家学者的重视。尤其在控制工程中,利用分数阶微积分能更精确简洁地对系统建模分析。分数阶优化算
学位
进出境货物查验是海关实施正面监管的重要手段。加强海关货物查验内部控制工作,对于贯彻落实国家总体安全观,更好地维护国门安全、防范风险,规制海关执法权力运行极具重要性。但是,在当前“关检融合”改革和“后疫情”背景下,海关货物查验业务内部控制在应对当前疫情防控、安全准入、腐化滋生等复杂的风险时遭遇挑战。如何与时俱进,创新优化,更好适应海关事业新阶段发展的需要,是“十四五”时期海关货物查验业务内部控制建设
学位
水体细菌微生物污染具有突发性、传播速度快、危害性大的特点,实现水体细菌微生物的在线检测,快速获取水体细菌污染的种类和浓度等信息,对建立水污染防治应急响应机制和保护饮用水安全具有重要意义。传统的生物化学检测方法大多需要样品预处理、精密的实验仪器和生化试剂,且操作复杂、耗时长,难以满足水体细菌微生物快速在线监测需求。多波长透射光谱法具有无需样品预处理、测量速度快、操作简单、无污染、无试剂等特点,且光谱
学位
内蒙古自治区幅员辽阔,东西跨度大,气候条件、土壤状况、种植制度、施肥制度在地区间存在一定差异。利用准确性高、特异性强的定量方法,是科学合理划分土壤养分和施肥管理分区、进行土壤养分肥力评价和制定不同管理区域的施肥推荐方案的重要技术手段和技术支撑。本研究以大量的土壤测试、田间试验数据为基础,综合应用地统计学、GIS方法、数理统计和推荐施肥方法,划定了内蒙古西辽河平原中氮中磷中钾施肥管理区(简称西辽河施
学位
本文主要研究拟有效向量丛和Sasakian流形上的横截全纯截曲率。在文章的第一部分,我们研究了某些非K?hler流形上的拟有效向量丛。我们证明了 Hermitian流形(M,ω)上第一陈数为零的拟有效丛E是数值平坦的,其中ω满足??ωn-1=0,??ωn-2=0。在文章的第二部分,我们介绍了 Sasakian几何基础知识,将Kahler几何中的若干曲率条件下的定理推广到Sasakian流形上。在文
学位
可穿戴下肢助行机器人是可被使用者穿戴且能够辅助穿戴者下肢完成行走任务的机器人系统,在助老助残、生活服务、工业制造、国防军事等领域具有广阔的应用前景,提升可穿戴下肢助行机器人的运动控制性能将对改善社会医疗康复服务水平、增强特定行业人员作业能力具有重要意义。然而,当前可穿戴下肢助行机器人的运动控制研究中还存在着运动不对称、跟踪不精准、交互不柔顺等问题。围绕当前研究存在的问题,本文选取下肢假肢机器人和柔
学位
放射治疗是治疗恶性肿瘤的重要手段,如何提高肿瘤的辐射敏感性是临床放疗面临的重要问题。辐射诱导的DNA损伤修复激活是导致放疗抗性的根本原因。因此,抑制肿瘤细胞的DNA损伤修复能力是增加肿瘤细胞对射线敏感性的有效途径。线粒体作为真核细胞中重要的细胞器和物质能量代谢的中心,被认为广泛参与了核内DNA损伤修复途径。传统观点认为外源信号诱导的DNA损伤修复信号是由线粒体ROS介导的。后来不断有研究发现,DN
学位
通过对材料的结构进行调控,人们可以得到目标性质并拓展材料的应用领域。实验上人们可以通过对材料施加压力、应变、掺杂、插层以及相变等方法来对材料的结构进行调控。相比于传统的块体材料,备受关注的层状材料和二维材料在材料结构调控上具有更强的可调性。本论文中我们研究了层状FeSe和单层ZrN等具有α-PbO型四方格子的二维材料,构建了高通量材料结构设计和物性计算平台,研究了结构调控对材料电声耦合强度、动力学
学位
光学湍流效应是是制约光电工程应用的重要影响因素,正确理解和分析大气湍流的原因和特性,对光电系统的设计和实施至关重要,而大气折射率结构常数Cn2是评估大气湍流效应的重要参数。湍流预报的核心在于大气湍流的参数化表达,探索采用机器学习的方法预报Cn2以及复原湍流退化图像是本文的研究内容。通常,近地面的湍流估算主要利用Monin-Obukhov相似理论;高空的湍流估算是基于Tatarski理论和一系列的外
学位