LSTM在多因子量化投资模型中的改进及应用研究

来源 :中央财经大学 | 被引量 : 2次 | 上传用户:bababa666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,人工智能无疑成为了全球最火热的技术研究领域,特别是深度学习方法的突破性进展,大大推进了人工智能方法的应用普及。目前,基于深度学习方法的人工智能已经被成功应用于语音识别、手写识别、计算机视觉、自动驾驶、自然语言处理等领域,取得了显著成果,这些研究成果大大推动了社会科技的进步。当前人工智能行业基础条件已经具备,随着深度学习算法日趋成熟以及数据资源的加速增长,人工智能技术有望不断提升。目前,基于深度学习的人工智能方法在医学诊断,图像识别等方面已经全面超越了人类,即使是在不确定性因素极大的金融市场,基于人工智能技术的量化投资也有逐渐替代依靠人工决策进行投资的趋势。事实上,除了学术界对深度学习在金融投资领域的研究越来越多以外,金融机构也大量利用深度学习算法在资本市场进行投资,并开始逐渐替代传统的人类主观投资。许多大型的对冲基金公司也开始布局人工智能领域,如桥水基金、文艺复兴科技公司、Two Sigma、Citadel等都组建了自己的人工智能投资研究团队。据统计,目前美国量化投资已经占到整个市场交易规模的一半以上,而在我国这一比例目前还不到十分之一。可以预见,在未来不长的时间内,基于深度学习的人工智能将大大改变我国现有的金融量化投资理论和投资模型,这必然对未来的金融领域的投资研究带来很大的影响,量化投资逐渐取代传统的价值投资这一趋势已经不可避免。然而,不同于深度学习在其他领域的的巨大成就,人工智能技术在金融领域的应用研究却并没有没有取得如此突飞猛进的成就。虽然许多金融机构投入大量的资源进行人工智能技术开发,通过机器学习、语音识别、视觉识别等方式来分析、预测交易数据、价格变动趋势等信息为客户提供智能投顾服务。但是由于金融市场具有很强的不确定性,而且金融交易数据往往具有复杂、高维的特征,这使得直接采用工智能方法进行金融数据分析并通过所得结果设计投资策略的方法具有很大的难度,而如何利用最新的人工智能算法技术来提高金融资产预测的准确率并降低投资风险是值得重点关注的问题。随着深度学习模型结构日趋复杂,训练数据不断增加,如何找到一个适用的模型结构来实现对模型的高效训练,是一个亟待解决的问题。本论文根据金融数据的时间序列特征,采用了深度学习中具有长期记忆效果的循环神经网络(LSTM)为主要方法,并将该方法对我国金融市场进行了多角度分析。本文以传统股票多因子模型为研究对象,从统计学的角度提出了一种基于Elastic-net的因子选择方法,并构造了一种集合Elastic-net与LSTM的多因子量化投资模型。另外,从控制风险的角度出发,本论文创新的提出了一种线性拉伸函数,并构造了一种新的RLF-LSTM量化投资理论。最后,本文还首次根据股票交易的特点,对LSTM遗忘函数进行了改进,提出了一种新的RFG-LSTM量化投资模型,并进行了回测检验。具体来说,本论文包括以下几个方面:论文第一章为导论部分。该部分首先从近几年人工智能的崛起,到各行业都在投入大量资源开展人工智能的应用研究作为背景介绍,简要介绍了深度学习方法在许多领域取得的巨大成就,并分析了将深度学习方法引入到金融投资领域的重要意义,然后罗列了本文的主要研究内容和研究逻辑框架,最后给出了本文从多个角度所开展的创新研究工作。第二章为深度学习研究的文献综述。文献综述分为4个部分,第一部分从浅层神经网络入手,介绍了人工神经网络的发展历程。从上个世纪40年代第一次提出神经元开始,到1958年感知器模型的提出,再到1986年BP算法的发明。该部分文献展示了神经网络的几次兴衰历程,从另一个角度也说明了人工智能研究的艰辛与曲折。第二部分为深度学习研究文献,该部分介绍了几种比较具有代表性的深度学习算法,如深度信念网络、深度自动编码器、深度玻尔兹曼机、卷积神经网络和循环神经网络的发展过程,并探索了深度学习的最新研究成果。第三部分是文献的重点,该部分文献展示了深度学习理论在金融领域中的最新研究前沿。通过梳理文献我们可以发现,利用神经网络进行资产价格预测其实早在上个世纪80年代就已经非常流行,但由于神经网络的计算“黑箱”问题,使得学术界许多研究金融的学者认为,人工神经网络模型偏离了金融计量经济学的基础,也脱离了传统金融计量经济学的研究范围。然而,随着计算机处理数据的能力日益增强,和深度学习在处理大数据方面具有的天然优势,使得近几年将深度学习方法应用于金融资产价格预测的研究成果大大增加,这些研究成果覆盖了传统的股票市场、债权市场和衍生品市场等,而且这些研究也表明利用深度学习方法可以达到比传统金融统计模型更好的预测效果。通过对这些文献的梳理也大大增强了我们利用将深度学习方法来研究我国金融市场的信心。第四部分对国内外文献进行了总结和评述。通过对国内外文献梳理我们发现,就国内外如何利用深度学习对金融资产价格进行预测方向来看,主要集中在高频数据方面,通过对海量的交易数据进行分析,寻找资产价格变动的规律,而如何利用低频数据进行深度学习研究的文献较少。论文第三章为深度学习算法理论基础。该部分首先介绍了传统的机器学习算法的基本原理和常见损失函数。然后介绍了神经网络与深度学习算法理论,包括人工神经网络的基本原理与发展历程,并对神经网络常见激活函数的性质进行了对比。本章的核心是对深度学习算法的介绍,从深度学习算法原理入手,重点介绍了循环神经网络中的长短记忆网络的网络结构、工作原理及网络变体。论文第四章构造了一种基于正则化方法Elastic Net与LSTM的多因子量化投资模型理论。验数据为2005年1月1日至2016年12月31日,所有沪深股票每日的股票因子值和收益率,共包括2915个交易日的3166只股票。在因子选取方面,本文从估值因子、市值因子、杠杆因子、财务因子、动量反转因子等多方面进行选择,一共选取了39个股票因子。本章第一部分从资本资产定价模型(CAPM)入手介绍了股票因子模型的基本思想,并梳理了目前股票因子筛选和因子得分评判方面的一些研究成果。本章的第二部分首先介绍了股票因子筛选的正则化方法,比较了Lasso、Ridge和Elastic Net的优缺点,并对Lasso和Elastic Net对因子回归结果进行了比较。通过实验对比发现,Lasso方法对因子系数进行了压缩,直接去掉了回归系数偏小的14个因子,只保留了25个有效股票因子,而Elastic Net方法压缩了10个因子,保留了29个有效股票因子。从后续根据OLS、Lasso和Elastic Net构建了量化投资模型来看,利用Elastic Net方法选出的29个因子构建的量化投资模型回测结果要优于OLS和Lasso方法。本章第三部分是在第二部分Elastic Net选出的29个股票因子的基础上完成的,本部分实验采用了Elastic Net方法选出的29个股票因子作为实验对象,然后比较了直接利用LSTM与39个股票因子和利用Elastic Net选出的29个股票因子与LSTM模型构建的量化投资模型的结果。实验结果显示,在模型迭代次数适当的情况下,基于Elastic Net-LSTM模型构建的模型效果要比直接利用LSTM模型构建的模型效果回测表现更好。论文第五章考虑到从投资者在实际操作中更看重风险的特点,对损失函数进行了修正,并提出了线性拉伸函数、指数拉伸函数和对数拉伸函数3种拉伸函数,然后分析了3种拉伸函数的性质,最后选取了线性拉伸函数作为均方误差的修正项,构建了新损失函数RLF,并给出了针对新的损失函数RLF的优化算法逻辑。另外,针对拉伸函数参数的选择问题,本章给给出了采用了试算法进行寻优的思路,也就是在固定其他参数的条件下,通过在实验数据范围内按照某一步长进行迭代尝试,选择预测误差最小的参数值作为修正拉伸函数的参数,之后给出了拉伸函数参数寻优的算法逻辑。本章第四节为实证分析,根据拉伸函数理论与Elastic Net选出的29个股票因子构建了RLF-LSTM量化投资模型,并在不同的迭代次数进行对比实验,模型实验结果显示了RLF-LSTM模型在可以有效降低风险,提高投资收益。本论文第六章从模型结构入手,考虑到LSTM模型的关键是引入了一组记忆单元的特点,而将深度学习方法LSTM应用于量化投资研究时,需要从金融资产价格变动的自身规律进行思考,并根据不同的金融市场特点来设计不同的研究方法。为了使深度学习算法更加贴近我国股票市场的真实情况,本章对LSTM网络结构进行改进,使得遗忘门函数只记忆股票价格在5个交易日中变动范围在[-1,1]的信息,而将其他噪声数据选择性的遗忘,提高了进入模型的数据所携带的信息质量。另外还将我国股市的交易成本因素加入到遗忘门函数模型中,提出了一种新的RFG-LSTM模型。然后构建了基于RFG-LSTM的深度学习投资模型。模型在不同的迭代次数下进行了多次实验,回测结果显示了RFG-LSTM模型的巨大应用价值。本论文第七章为结论与展望部分。该部分总结了的本文的主要研究成果,认为本文的研究拓展了深度学习在金融领域的应用边界。但也指出了研究的不足之处,并展望了未来的研究方向,并作为下一步研究的指导。本文的创新之处在于将深度学习与股票多因子模型相结合,并提出了多种改进方案,把握了这一领域的研究前沿,选题视角和立意都具有一定的新颖之处。在作者所涉猎的文献中,本文属于首个利用Elastic Net进行股票因子筛选并构造基于多因子与深度学习的量化投资模型的研究,在模型应用上有所创新。另外,本文也是首个提出利用拉伸函数降低量化投资模型风险并构造了RLF-LSTM模型的研究,同时也是首个提出修正遗忘门函数并构造了RFG-LSTM模型的研究,为推动人工智能方法在我国股票市场的应用提供了新的思路。
其他文献
过去20年,国际上成功商业化了热浸镀锌铝镁镀层。该镀层以Zn、Al、Mg三元合金为主,按Al含量的范围,可分成"低铝"、"中铝"、"高铝"3大类。因锌铝镁镀层具有高平面耐蚀性和高切
为探讨多功能肛肠综合治疗仪(HCPT)与传统的手术方法治疗各型肛周常见疾病疗效,将需要手术的患者300例随机分为2组,每组各150例,分别采用HCPT和传统的手术方法进行治疗。观察
随着电子器件的微型化和智能化发展,导电纳米材料将广泛应用于柔性电极、传感器、电子封装、微波吸收、电磁屏蔽等领域。金属纳米材料表现出独特的物理和化学性能,同时也为纳
本文主要是介绍了虹鳟鱼的加工过程中通过对加工时间的控制来观察对肉的嫩度及感观的影响。随着腌制时间的增加,产品感观评分增加,但是当腌制时间继续延长,感观评分急剧下降,
目的 探讨造口旁疝的病因、修补方法及临床疗效.方法 回顾性分析2006年7月至2010年7月安徽医科大学第二附属医院收治的腹壁造口旁疝64例,手术治疗24例,比较三种手术方式的术
铯原子喷泉钟作为复现“秒”定义的时间频率基准装置,具有最高的准确度性能,在航天航空、精密定位、基础物理、大地测量等领域有着广泛应用。铯原子喷泉钟是以冷原子粘团为工作
随着城市化进程的迅速发展,交通拥堵已成为世界各大城市所共同面临的问题。在日益严峻的交通环境下,智能交通系统(ITS)正获得越来越广泛的应用。然而,ITS硬件设施迅速发展和
《铸剑》以故事引出复仇之路,以复仇终结了人物形象,又以闹剧颠覆了严肃的复仇故事本身。鲁迅先生对这则故事的再创作,运用了古代的素材、现代的理念。对“铸剑”故事的重写,
目前,在中小企业发展过程中,融资难、资金利用率低是困扰中小企业发展的重要问题,而解决这一问题的关键在于提高企业间的金融数据流通。使业务交流频繁的企业组成团体,借助团体贷款系统实现企业间的资金互助,是解决上述问题的方法之一。然而,现有的团体贷款系统也存在多方面不足:一方面贷款信息交给银行或者第三方管理者进行监督管理,贷款效率低,在时间和人力耗费上需要增添大量成本,并且数据记录得不到保障,存在记录信息
<正> 在利用电化学原理的测试系统中,参比电极体系通常需要满足:1.电极必须是可逆的,且符合Nernst方程;2.电极交换电流要大,即不易极化;3.容易制备;4.无温度滞后性,具备较好