基于深度强化学习的量化投资策略研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:maowang300miao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
量化投资已经成为强化学习领域的研究热点,特别是股票、外汇和期货等方面具有广泛的应用需求和学术研究意义。基于深度强化学习构建的量化投资策略可以随时根据金融市场的变化进行自主调整,实现感知市场变化并进行决策,使量化投资实现智能化。本文基于深度强化学习对量化投资策略进行研究,主要完成了以下工作:(1)基于深度强化学习实现量化投资,针对前期策略训练效率低、训练时间长的缺点提出裁剪PPO进行改进。保留标准PPO算法对轨迹的高利用率,抛弃标准PPO算法的值网络,避免值网络训练不收敛。实验验证裁剪PPO能够提高策略训练速度,提升策略性能。(2)针对策略输出动作的有效性与持仓状态有关的问题提出动作塑造改进。动作塑造从根本上保证策略输出有效动作,确保策略输出动作都能真实反映在交易环境中。实验结果显示,这种改进使得策略优化更加稳定,提升了获利能力。(3)针对将策略获得的收益分配给不同交易动作的难题提出了优势塑造技巧。通过塑造不同优势函数将收益分配给交易中的建仓、持仓、平仓等动作,实现对不同动作优化的平衡,调节策略交易频率。实验验证它可以进一步提升策略的收益。(4)针对策略优化不稳定、训练效率低、性能不理想等问题提出路径引导技巧。路径引导使得策略对环境探索更加合理,收集的轨迹质量更高。实验验证路径引导能极大地提升训练效率,显著提升策略性能。本文的研究拓宽了深度学习和强化学习理论的应用,也丰富了金融投资工具。所提出的改进提升了算法训练效率和策略性能,对将强化学习应用于金融领域具有参考价值。
其他文献
农业产能合作是提高农业综合生产能力、促进农业产业结构优化、实现农业可持续发展的重要路径。金砖国家作为重要的新兴经济体,研究近年来其产能合作状况及未来发展趋势,对于
目的:探讨颌面外伤伤员的心理创伤。方法:对457例颌面外伤住院伤员进行心理调查。结论:415例(91%)有心理创伤,主要表现为恐惧心理和忧虑心理。心理创伤的发生与伤员性别和损伤阶段有明显关系
社会的发展给我们带来了富足的生活,但快节奏和各种压力也成为困扰现代人的一大烦恼。生活中,人们需要主动调节自身情绪,了解情绪的分类和成因。反观现实生活中,由于缺乏对情绪的认识,隐藏、压抑自身负面情绪的情况并不少见。为了让更多的人了解情绪问题、重视情绪问题,笔者选择了以情绪为主题的翻译文本《释放情绪找回自我》(《あなたの“好き”を愛で覚醒喜怒哀楽を解放して自分らしいあなたになる方法》)。作者分别从“喜
现代企业的竞争是“人才”的竞争。我们想要立于不败之地,实现自身的发展,就必须拥有一批高素质、高水平的管理人才和员工队伍。随着知识和技术的快速更新,企业需要创新,需要引进最新的技术和新的思想,不断培训员工。通过培训,不仅可以提高员工对企业决策的认识和执行能力,让员工对企业管理理念和方法有一个清晰明确的认识,并且能够在此基础上,提高员工综合素质水平,增强企业的核心竞争力。它还可以灌输员工企业价值观,培
近年来,中国与新西兰、澳大利亚乳制品贸易曰益频繁,尤其自《中新自由贸易协定》《中澳自由贸易协定》签署后,新西兰和澳大利亚分别成为中国乳制品进口来源的第一和第二大国,
环境污染日益严重的今天各国都在大力推广新能源汽车,在纯电动汽车的续驶里程问题、电池价格昂贵问题以及与纯电动汽车配套的基础设施不完善问题得不到有效解决之前,插电式混合动力电动汽车(Plug-in Hybrid Electric Vehicle,PHEV)因其油耗排放低、无里程焦虑问题而受到市场的青睐。整车控制器开发是整个PHEV开发的核心,整车控制器的优劣决定了整车的动力性、燃油经济性和汽车排放。本
开心麻花团队的喜剧片在电影市场上一直表现不菲,从《夏洛特烦恼》《羞羞的铁拳》再到《西虹市首富》《李茶的姑妈》,积累的票房和口碑使得开心麻花的喜剧片在同类型喜剧片中
工会应该在公立医院稳步持续发展中发挥其职能作用,特别是对新医改的推进作用、缓解医院职工压力方面的减压作用以及连接医院与职工的桥梁和纽带作用等。医院工会应该适应新
环形薄壁焊接结构在生产实践中有着广泛的应用。在现行工艺条件下统计火焰筒衬套组件焊接变形基本规律。并采用有限元分析软件ANSYS模拟火焰筒衬套组件焊接过程,模拟马鞍与内
论述了多源信息数据融合仿真试验系统的设计思路、设计内容;阐述了数据融合仿真试验中的三级工作模式。及对应的二级仿真试验系统设计。