基于图神经网络的深度强化学习方法在投资组合管理中的应用

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:leovvex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济不断发展,根据中国统计局2019年发布的信息,我国GDP同比6%左右增长,全年全国居民人均可支配收入同比增长8.9%。我国居民收入不断提升,有了更多的闲置资金,产生了更多的投资需求,有投资意愿的人约占总人口的65%,这对提高投资组合管理效率提出了更高的要求。投资组合管理最基本的思想是要平衡风险和收益,该思想是由马科维茨在均值-方差模型中提出的,通常可以用夏普比率来衡量一个投资组合的好坏。在文献中,有许多相关研究,有基于均值-方差模型进行优化的传统算法,也有基于传统机器学习的算法。但由于金融市场的复杂性,这些并不能完全捕捉市场信息。随着大数据的兴起和计算机技术的发展,深度学习可以学到传统模型难以捕捉的深度信息和特征,往往会有更好的预测效果;同时强化学习算法因具备决策优化能力,更加符合投资组合管理决策的逻辑,因此可直接应用于投资组合管理上。综上所述,本文考虑使用深度强化学习算法解决投资组合管理问题。在现有文献中,投资组合管理的深度强化学习算法有两个问题,一是提取特征时对于投资组合中金融产品间的相关性把握不全面,忽视了金融产品间的关联性;另一个是在进行资产组合调整时,很难考虑到当前已经持有的资产组合,这样会忽视资产组合调整时带来的成本与收益问题。针对这些问题,本文提出运用图神经网络进行特征的提取,通过相似度矩阵以及谱聚类方法来获取市场的图结构信息,以此让模型可以考虑到金融产品间的关联性息,同时利用当前持有的资产组合比例向量对于获取市场的图结构信息进行加权修正,让模型能够关注到已经持有的投资组合情况,做出更加合理的决策。本文采用股票市场的真实数据对算法进行了实证研究,采用了万得数据库中提供的沪深300的股票数据,包含300支股票从2014年6月到2020年7月的日度数据。本文选取了股票开盘价,收盘价,涨跌幅,交易量,市盈率,市净率六个和收益率或波动率相关的特征,并且选取之前一周,五个交易日内的特征来获得短期历史信息,并对每个特征选择近一个月内的数据计算其指数加权平均数来获取更长期的历史信息,以此建立共计6*5=30个特征。本文通过谱聚类和分层抽样实现了市场的模拟,选取了199支股票进行建模,同时引入了现金当作一种资产选择。在此基础上构建了基于归一化优势函数算法(NAF算法)的强化学习算法,策略为调整资产组合的持有比例向量。在设计强化学习框架时,本文设计奖励函数时把收益当作奖励函数,同时奖励的折现率设置为无风险利率以贴合现实逻辑。设计策略时,考虑了现实市场情况,股票买入隔天才能卖出,所以设为日度交易,并且计算成本时完全按照中国市场情况,分买入和卖出分别计算。同时考虑到消费者心理,设立止损机制,亏损到一定程度后会结束交易,这样综合考虑了短期和长期收益的平衡及消费者的心理承受能力。在此基础上,本文在测试集上进行了验证。首先验证了本文所使用的图神经网络、以及把持有投资组合向量作为权重的方法的有效性,可以发现图神经网络可以有效提取市场信息,持有投资组合向量可以让模型能够关注到已经持有的投资组合情况并作出更好的决策,本文提出的算法相较于之前的的使用卷积神经网络,循环神经网络的算法在不同的市场情况下(包含牛市,熊市和波动较大的市场)都取得了更好的投资回报。同时本文算法学习到的策略在不同市场情况下均取得了稳定的收益率,并且显著超过了市场大盘水平,在不同的市场情况下,收益率均超过沪深300指数10%以上;在各种市场表现下,相较于其他以股票为标的物的基金:股票基金、被动指数基金、和增强指数基金,都取得了显著超过其平均水平的表现,有着稳定出色的表现,不随市场的波动而发生起伏。其收益率稳定超过指数类基金15%以上,波动率相较于股票基金下降了20%以上。本文算法学习到的策略的表现不同于股票基金和指数基金,没有股票基金那么高的波动率,同时相较于指数基金有更高的收益率,并且稳定取得了较高的夏普比率,整体投资风格趋向于成长型基金,比较适合希望希望获得长期稳定收益的投资者。本文研究得到的策略具有一定现实意义,并且相较于市场上已有的基金也有一定的优势,比较适用于那些不满足于指数基金的低收益,同时也担心股票基金风险太高的投资者们。并且使用图神经网络来提取市场信息的思路,也在实证中得到了验证。对其他金融相关业务有一定的指导意义。
其他文献
近年来,随着全球性的经济发展以及世界各地区的经济增速和动能的衰弱,以及全球性的债务水平的升高以及金融市场的局部动乱等一系列问题的日益加剧,资本直接进行的投资活动也略显较为低迷。尤其是2020年新冠病毒疫情爆发以来,美国、欧洲和其它许多国家政府不尽如人意的处理,导致投资者对经济发展形势进一步看衰,全世界范围内的经济十分不稳定。在此背景下,黄金和许多其它虚拟货币的价格均出现了较大幅度的上涨,加剧了相关
学位
线性双自回归模型(Linear double autoregressive(DAR)models,LDAR)可以用来很好地拟合厚尾数据,它的条件均值和条件标准差部分均采用了线性结构,其模型结构使其更加具有稳健性。目前,线性双自回归模型已有的估计方法是由Zhu et al.(2018)提出的双加权分位数回归估计(DWQRE),最优DWQRE估计量的渐近方差在特定的条件下可以达到CR下界,该估计量的渐
学位
在社交媒体高速发展的今天,网络上的社交文本形成了一个极具价值的文本库,尤其是对于美妆品牌而言,中国市场的美妆行业近几年正在急速扩张,其中新模式社媒营销起了很大的推动作用,比起其他行业,美妆行业是较早应用互联网技术进行社会化媒体营销的行业之一,因此社交文本成了该行业一个很重要的信息来源。本文旨在通过分析社交媒体平台中消费者关于美妆品牌的真实评价,提取合适的关键词进行情感分析、IPA分析及共现分析,使
学位
命名实体识别是指识别出一段文本中具有人名、地名、专有名词等特定含义的实体。中文命名实体识别任务是自然语言领域的基础任务,是许多上游任务的基石,而医学文本是中文命名实体识别的一个非常重要的领域。本文就医学文本命名实体识别中存在的嵌套实体识别难的问题提出了一些有效的解决方案。对于命名实体识别,业界通常采用序列标注的方法来识别实体。对于非嵌套实体这样做是方便且有效的,但是对于嵌套实体而言,会出现一些问题
学位
随着互联网时代的到来,社交网络蓬勃发展,已成为当代社会信息传播的重要渠道和载体。在线社交网络中每天产生海量且流动的信息。然而信息流行度分布极其不均,绝大部分信息的流行度较低,只有极少数信息具有着较高的流行度。因而了解信息是如何传播的,以及什么样的因素驱动信息的传播,并对信息流行度进行预测成为了广大科研人员的关注热点。本文针对社交网络中的信息流行度预测问题展开实证研究,主要内容如下:对社交网络流行度
学位
在如今的大数据时代,信息传递与反馈变得尤其快速,随着科学技术的不断发展,人类社会步入崭新的信息化时代,互联网的迅速发展使得人们的生活方式发生了极大的改变。各种打车的APP层出不穷,出行变得越来越方便。而对于运营打车APP的企业,在市场竞争不断加大的情况下,如何更好的运营,对不同的乘客使用独特合理的策略,从而提高收益和留存率,成为大家关注的话题。乘客干预效应是智能补贴算法的一环,它的涵义是指乘客被发
学位
随着互联网的快速普及,电子阅读逐渐兴起,各大电子阅读运营平台通过各种形式和渠道拉取新用户,以获取更多的市场份额。与此同时,用户切换使用平台,几乎无需付出任何代价,使得各电子读书服务平台正面临或即将面临高用户流失风险。哈佛商业评论研究显示降低5%的用户流失率可以使企业的利润增长25%至85%。随着电子阅读市场的竞争越来越激烈,电子读书服务平台有必要对现存活跃用户进行流失判断并分析原因。本文所构建的用
学位
近年来,互联网特别是移动互联网的迅速发展,使得网上购物变得方便、快捷,且相较于传统线下购物的方式网上购物价格更加透明,更多人趋向于网上购物。2020年淘宝双十一购物狂欢周创造了总交易额5249亿元的“神话”,仅双11当天的全网销售额就为3328亿元,京东11月1日至11月11日购物节的全网销售额在2715亿元,苏宁易购线上订单同比增长72%。互联网电子商务企业大促成绩亮眼,不仅反映了国内消费者的强
学位
本论文主要提出与国内商业银行对公活期存款业务有关的研究问题并进行量化分析。法人活期存款作为商业银行的一项重要业务指标,近年来在利率市场化的背景下呈现显著下降的趋势,然而目前少有从微观业务角度出发、针对商业银行内法人活期存款的影响因素进行量化探究分析的理论成果。因此本论文主要通过量化分析的方法对法人活期存款余额及其增幅的影响因素进行探究,验证结算及贷款业务指标对法人活期存款余额及其增量的显著影响。法
学位
广告,是广告主向他人推销自己产品或服务的一种方式,此方式不仅方便快捷,实际上也成为广告主商业变现的很大一部分来源。随着互联网的发展,广告的形式已逐渐从线下转换到线上平台,其中应用最广泛的便是互联网搜索广告模式,该模式以付费手段来提高网站的权重,结合搜索引擎根据用户的即时兴趣定向投送广告。该模式被称为搜索引擎营销,已经逐渐成为各大广告商的首选,这其中最关键的步骤就是需要从广告中提取出一系列关键词,再
学位