股票多因子挖掘的集成学习模型及系统实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:qq330525312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济发展及居民可支配收入的不断提高,大众对于投资的热情与日俱增,如何行之有效地选择股票成了一个热点问题。在众多的选股模型中,多因子模型是应用的最普遍的一种,其基本原理为采用一系列因子作为选股标准,从而买入符合因子特征的股票。然而,种类繁多的因子很难用传统的方法进行分析,因此本文试图从分类的角度研究因子和收益率的关系,建立多因子集成学习模型对不同时间周期的变动趋势进行预测,并构建原型系统对该模型的效果予以评估验证。本文在超参数调优的基础上分别建立选股模型,并通过滚动建模和行业分层实验,结果表明在大多数时期AUC值均大于0.5,证明了本模型分类能力。本文还与多种机器学习算法在运行速度和选股能力方面进行比较,结果显示XGBoost和Light GBM算法在训练效率和股票预测能力均强于其它集成学习算法,而Light GBM算法的表现要更胜于XGBoost算法。为了验证模型的实际效果,本文还使用Light GBM算法建立的选股模型,在2019年1月至2021年12月的时间周期内,分别在覆盖范围不同的股票池内进行选股并建立投资组合,每季度末进行调仓,并与对应基准指数进行对比,评估模型在选股方面的实际表现。结果表明由本模型构建的投资组合在不同风格的市场上均表现良好,取得更高收益的同时具有更低的风险性。为了验证上述模型的效果,本文设计并实现了原型系统,并根据软件工程流程规范,完成需求分析、概要设计、详细设计及测试等方面工作。系统主要功能包括基于算法模型预测数据的股票评估和股票推荐模块,以及基于用户使用热度的热门股票模块。此外,系统还提供对于个人账户信息和自选股的管理功能。其中股票因子数据来源于采集模块的每日定期采集工作,用户使用热度数据来源于前端埋点获取的用户行为数据。经过测试和对比研究,本文的多因子集成学习选股模型,在理论检验上经过验证,兼顾有效性与稳健性,且在不同风格市场和行业范围的实际选股中均战胜了基准指数。依据该模型搭建的原型系统,能够为初级至中级投资者提供一定程度的数据支持。
其他文献
青少年期是人格发展的黄金阶段,在此阶段如遭遇校园欺凌会严重危害青少年身心健康发展。社会工作者秉承“助人自助”价值理念,以专业理论基础和工作技巧,可帮助校园受欺凌者走出困境,解决服务对象的问题,使其增强自身能力,有效降低欺凌事件的发生几率,使校园受欺凌者顺利走出校园欺凌的阴影。本研究在收集校园受欺凌者小A相关信息基础上,分析案主遭受校园欺凌的原因及校园欺凌带来的创伤反应。在增能理论指导下围绕案主需求
学位
随着工农业现代化的飞速发展,污水排放造成的污染日益凸显,而村镇污水处理率明显低于城市。这是因为村镇污水处理站数量众多且位置分散,基于人工对设备运行是否正常的监测非常低效,使故障设备难以被及时维护,直接影响了污水处理率,因此提高村镇污水处理监测效果成为一个重要的研究问题。目前相关研究中已有基于物联网(IoT)的村镇污水处理监测系统解决此问题,此类系统借助数据采集器在脱离人工的情况下自动采集和分析污水
学位
无人机和北斗卫星的不断发展,给人们带来了新的生活方式,也让人们更多的接触到遥感图像,如今人们可以在几乎任何地方使用无人机拍下与以往不同视角的图像。现有的目标检测方法已经可以比较好的执行目标检测任务,然而在遥感图像中执行检测时会有一定的精度损失,这是由于遥感图像中存在着大量的大长宽比且密集排列的倾斜目标,在该场景下执行非极大值抑制算法会有较大的误差。因此,本文提出旋转目标检测方法,以更为精确的表示方
学位
深层的深度学习模型虽然通常拥有高性能,但计算复杂性和存储需求要求较高,使得这种深层模型在车载终端设备和个人移动设备等资源受限的平台上部署较困难。知识蒸馏作为一种特别的模型压缩方法,采用教师模型传递知识给学生模型的训练方式,可以将具有较低的推理时延、较弱的算力和较少的存储量的轻量级学生模型的准确率提高到接近教师模型的水平,满足资源受限的平台部署和运行需求。目前知识蒸馏算法普遍存在知识形式差异较大,以
学位
近年来,停车泊位的建设速度赶不上机动车的增长速度,“停车难”已经成为城市停车场管理的主要难题,尤其是在人员密集的商业区办公楼停车场,停车难现象更加突出。为了解决停车难题,办公楼通常采用月租泊位和临时泊位混合的停车策略,通过停车泊位数字化管理,可以帮助驾驶员快速找到可用停车泊位,但不合理的分配策略造成停车资源浪费,如何科学地调度停车泊位对停车场资源使用效率提升具有重要意义。目前解决停车难问题的措施主
学位
共识机制是区块链领域的重要研究方向之一,如何设计高效、安全的共识机制是近年来的热点问题。联盟区块链在采用实用拜占庭容错协议进行共识时,在性能、安全和隐私三个方面面临挑战。大多数联盟链专注于提高协议性能和可扩展性,却忽略了隐私保护或安全性。此外,联盟链还存在覆盖应用场景较少、共识机制实用性较低等问题。针对以上问题,本文通过结合Schnorr多重签名、环签名和实用拜占庭容错协议提出一种全面的联盟链分层
学位
钢结构建筑具有自重小、强度高、机械化程度高和结构安全性好等优点,而作为我国主要的建筑结构之一被广泛应用。随着国家社会经济的高速发展,钢结构建筑的结构形式朝着大跨复杂的方向发展。为满足建筑设计和成本的要求,现有的大多数不等跨结构往往会采用左右梁高不等的方式,即不等高梁柱节点(UEH节点)。但这些节点在遇到地震影响时很容易出现脆性破坏,无法在震后立即修复并投入使用。本文提出一种带H型阻尼器的UEH梁柱
学位
随着人民生活水平的提高,城市道路上车流也变得越来越拥挤,仅依靠封闭式停车场对车辆进行停放管理已经无法满足实际车辆停放需求。因此,不少城市通过在部分支路两侧划分停车区域的方式满足市民车辆停放需要。但是对于该类停车场的管理需要耗费大量的人力物力,给城市管理带来巨大的挑战。本文所研究的车辆重识别算法便应用于该场景以实现道路两侧停车场的智慧管理。但是在基于道路场景的车辆重识别算法的研究中,除了受限于高位摄
学位
随着激光雷达技术日益成熟,三维点云数据采集变得更加容易,三维点云数据越来越多地被当作环境感知数据应用于科研和工程领域。同时,深度学习技术的飞速发展使得基于深度学习方法的三维点云目标分割技术也广泛被应用于自动驾驶、辅助驾驶等领域。虽然,三维点云数据采集技术和处理技术已经很成熟,但目前国内外在公路三维点云公开数据集领域一直面临数据集匮乏的问题,这严重制约了在公路环境下实现三维点云目标分割算法的发展。同
学位
为实现可持续发展,压缩能耗、减少碳排放刻不容缓。聚合物齿轮符合当今制造业轻量化的发展方向,而面对工业应用中日益提高的齿轮承载能力的需求,弥补传统对称齿轮的强度不足的问题,可选用非对称齿形设计的聚合物齿轮。对齿轮润滑进行研究能够有效延长传动系统的使用寿命,减少动力传递的损耗,因而研究非对称聚合物齿轮润滑符合节能减排的宗旨。为揭示非对称聚合物齿轮润滑的相关机理,改善非对称聚合物齿轮的润滑性能,本文对非
学位