深度强化学习在股票投资组合管理中的应用研究——以中国A股市场为例

被引量 : 0次 | 上传用户:sharkzw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票投资组合管理问题一般被认为是一个包含高维输入和连续决策的复杂系统工程,这一特点恰好与深度强化学习(DRL)的强大感知能力和决策能力相契合,因此将DRL算法应用于股票投资组合管理具有重要意义。首先,本文进行了DRL建模的可行性分析,在模型假设的基础上设定了模型的重要概念(包括环境、状态、动作和奖励),并采用DDPG、TD3和A2C这三种前沿的基于执行者-评论家架构的DRL算法,构建了基于DRL的股票投资组合管理模型。其次,在构建的DRL模型基础上,结合行业特征筛选了上证指数成分股中的10支股票构造投资组合,训练集和验证集时间区间分别为2015.1.1-2019.6.30和2019.7.1-2020.12.31,将投资组合的价量信息、筛选的技术指标和协方差矩阵作为状态输入,持仓权重作为动作空间,分别采用DDPG、TD3和A2C算法进行训练,将上证指数和最小方差投资组合作为比较基准,并通过年化收益率、波动率和夏普比率等指标对回测结果进行了综合评价。最后,考虑到我国股票市场中股票存在最小交易量限制的现状,对上述DRL模型进行了改进,将连续的权重动作空间调整为离散的持股数量动作空间,重新利用DDPG和TD3算法进行训练,并对结果进行综合评价。研究表明:在基于权重的DRL投资组合管理策略中,TD3和A2C算法均获得了超越比较基准的表现,DDPG、TD3和A2C算法策略年化收益率分别为20.28%、28.98%和29.91%,夏普比率分别为0.91、1.23和1.25,而同期上证指数的表现仅为8.16%和0.52,最小方差投资组合的年化收益率和夏普比率分别为24.97%和1.12。改进后的DRL模型相对于改进前出现了较为明显的提升,DDPG和TD3算法策略的年化收益率增长了约20%,夏普比率增加约0.50。上述结果说明基于DRL的投资组合管理策略能够有效用于我国A股市场的投资组合管理中。
其他文献
自由空间光(Free Space Optical,FSO)通信易受时变大气信道的影响,通信的有效性和可靠性极大程度上依赖于对信道状态的认知。在无线激光自适应系统中,为了实时调整传输参数以适应时变大气信道,在传输性能和传输速率中做到有效平衡,就需要在接收端对大气信道物理状态信息进行估计。接收机光电探测过程中,接收信号会包含背景光、探测器本底噪声(或散粒噪声)和电路热噪声等,这将对大气信道衰落参数估计
学位
越南是社会主义国家,国有经济占据举足轻重的地位,国企是国民经济发展的重要支柱,更是越南实施国家经济发展战略和创新项目的骨干力量。为维护国有经济在国家经济中的主导地位,越南自革新开放以来开始推进国企改革,通过重组、股份化等措施提高国企效益,至今已有30多年。国企改革推动了越南经济发展,为越南社会主义建设提供了牢固的经济基础。越南军队电信集团(Viettel Military Industry and
学位
近年来复合材料广泛地代替金属材料应用在复杂结构件上,通过环形编织机编织出的预成型体性能优异,逐渐在航空航天、船舶、医疗等领域有了广泛应用。编织角作为预成型体的重要参数,对预成型体的性能有重要影响。本研究以保持异形结构件编织角稳定作为主要目的,对异形结构件编织过程中的控制策略进行研究。环形编织机在编织过程中,当编织参数发生变化时,编织角不会马上改变,而是有一个变化过程,具体表现为收敛长度的变化。这就
学位
在建设前期进行投资决策时,工程造价估算值是关键的参考数据,是编制项目建议书和可行性研究报告的依据,贯穿于后续项目实施的各个阶段。精准高效地估算工程造价一直是从业人员关注和研究的重点,估算准确与否将直接影响项目的投资决策,对各参与方至关重要。随着机器学习的蓬勃发展,各种智能算法在工程造价估算领域得到应用,以求能够快速准确地预估工程造价。本研究选择办公建筑为研究对象,选用适宜的机器学习方法,旨在构建误
学位
随着数字化技术的兴起,数字经济时代的高阶发展,世界各国的政府与税务部门纷纷主动或被迫寻求创新税收征管方式以适应新阶段的经济运行模式。积极利用数字化技术,改变传统税收征管方式成为众多国家快速提升税收征管质效的重要方式。在我国经济数字化快速发展的时代背景下,中办、国办于2021年3月发布《关于进一步深化税收征管改革的意见》,明确全面推进税收征管数字化升级和智能化改造,加快推进智慧税务建设,深化税收大数
学位
近年来,深度强化学习(Deep Reinforcement Learning,DRL)已成为人工智能领域的新兴技术之一,它结合了深度学习(Deep Neural Network,DNN)的特征提取能力,以及强化学习的序列决策能力,解决了许多重要问题并取得了显著成果。然而,由于DRL引入了DNN作为策略输出,其黑盒性质在实际应用中同样面临着诸多安全问题,包括对抗攻击、模型窃取以及后门攻击等。尤其是在
学位
本翻译报告材料节选自拉尔夫·蒂勒(Ralph Thiele)所著的军事科技文本《混合战争:未来与科技》(Hybrid Warfare:Future and Technologies)。该书介绍了混合战争的概念、方式手段及应对措施,强调高新科技的发展对混合战争的推动作用。译者所节选书中的前言、序言、概要、第一章以及附录1、附录4,主要介绍了混合战争的背景和发展趋势,深入探讨5G技术和人工智能等高科技
学位
我国对中小学生个人信息保护的研究多见于未成年人个人信息保护,甚至一般主体个人信息保护。相关论述也分散于各类文献中,直接对中小学生个人信息保护的研究较少,而从学校保护角度研究该问题的更是不多。虽然近些年国家和社会对未成年人和个人信息保护的重视程度越来越高,但中小学生个人信息从未被准确界定,其在学校保护层面的问题也有待被进一步研究。论文结合我国在此方面的立法情况以及欧盟、美国的保护制度,针对我国目前中
学位
作为世界上主要的三大油料作物之一,油菜是我国种植面积最大的油料作物。但是作为一种以收获籽粒为主的经济作物,相较于水稻和花生等具有50%以上收获指数的作物,油菜栽培品种的收获指数却只有20-30%,因此提高油菜收获指数对提高其产量显得尤为重要。在影响收获指数的“源、流、库”三因素中,油菜有充足的源和库,因此研究流-即光合同化物的转运和分配成为提高油菜收获指数的突破口。油菜青荚期的光合作用可为籽粒产量
学位
近年来,磁性Fe3O4纳米材料因其超顺磁性、高比面积和生物相容性等优点,广泛用于生物医药、磁分离和生物分子富集与检测等领域。然而,由于粒子稳定性差和粒子间的偶极-偶极相互作用,导致Fe3O4易氧化和团聚,限制了其应用潜力。为了增强其稳定性,人们采用相应的修饰策略为Fe3O4纳米粒子提供稳定性的外壳(如二氧化硅、贵金属、小分子表面活性剂和聚合物等)。在众多包覆材料中,二氧化硅不仅赋予了Fe3O4优异
学位