论文部分内容阅读
在现代化程度越来越高今天,人工智能在日常生活,工作娱乐等各方面都起着不可替代的重要性。而作为计算机科学子集的机器学习是技术领域中发展最快的领域之一。它被认为是实现人工智能和数据科学的核心领域。最近几年,由于计算机硬件水平的快速提升,过去的一些强化学习算法通过与机器学习算法中的神经网络结合之后,对处理特定的问题例如医疗,教育,制造,警务,财务建模和营销等各个行业的决策中起着重要作用。强化学习是设计强调实时响应的人工智能系统的核心组件之一。随着对更复杂的机器工作的需求不断增长,这推动了机器学习领域对基于强化学习的方法的需求。强化学习会使得系统在任意环境中采取行动,无论该环境是否具有有关环境模型的先验知识。如今,深度强化学习已成为学术界和工业界的热点,研究和挖掘强化学习拥有很好的理论意义和现实工程应用价值。现实世界中存在各种各样需要策略控制的场合,而由于强化学习作为一种关于研究智能体决策和行为策略的方法,其功能和作用已得到了很多研究和实证,也是学者们认可的一种方法,所以怎样有效地应用强化学习优化改良各种智能体策略,成为了学者们钻研的重点和难点。其中把强化学习与情感分析结合作为一个重要的理论研究方向,可是目前为止有关它的研究工作仍相对较少,而且依旧有着应用效果不好、准确率低等问题。因此,本文利用情感分析和深度强化学习相关的特性,并且使用各种算法的优化来处理上述的问题,主要的研究工作和成果如下所示:(1)关于策略问题的研究选取了模拟股票市场交易问题进行调研,对目前解决股票交易问题的相关技术进行介绍,并重点研究现阶段股票交易系统的局限性。(2)本文利用股票交易市场的特点设计了一种结合知识图谱的情绪分析方法。该方法使用知识图谱寻找可以应用于情绪分析的新闻标题,将新闻及其观点作为标题,在知识图谱上找到了它们与相关股票之间的关系之后,最后使用深度学习学习得出对应的新闻标题情绪,通过对比实验发现本文使用的方法结果比传统方法准确性更高。(3)基于对新闻标题的情绪分析得到的情绪值,将其输入到深度强化学习模块中,再结合优先经验回放技术改善每次抽样数据的效率,最终训练出一个能够在真实股票市场盈利的智能交易机器人,其结果具有良好的鲁棒性。本文实现的结合情绪分析和知识图谱的深度强化学习系统,不仅从理论方面对算法进行了分析,而且模拟股票交易市场的数据进行了实验比较和分析。实验结果说明了本文使用的结合情绪分析和知识图的深度强化学习算法能够比于已有的传统强化学习算法取得更好的收益,具有更好的实际应用价值。