基于海量文本挖掘的证券市场情绪监控及预测

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:fengk9000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0和移动互联网催生了网络上用户海量内容的生成。证券市场上的用户同样地喜欢通过社交媒体来表达自己对市场的看法和情绪,因此社交媒体近年来吸引了研究者和业界的大量关注,但是从这些社交媒体中抽取出对研究和产品有帮助的信息存在各种困难。为了有效地从社交媒体中抽取出证券市场用户的情绪信息,并且探索其对证券市场的影响,本文针对证券市场用户内容数据特点,提出了证券市场市场情绪分类算法;在市场预测方面,针对传统金融时间序列预测存在的问题,提出基于RiskReturn的金融时间序列预测算法;进而,将预测模型应用到实际交易情境下,通过量化交易分析的手段,研究其在证券市场上的表现。本文主要内容包括以下三个方面:第一,针对Web2.0时代用户数据较为混乱的特点,提出了Encoder-Decoder句表征的方式,将所有的文本映射成为高维的语义向量,通过标注数据集,训练神经网络分类模型,对海量数据进行情感分类,分类的准确率达到81.23%,并和已有的方法准确率进行比较,证明了方法的有效性,并考虑标注成本下,在不同标注量上和已有方法比较,证明了本文的分类方法在少量标注集就有优秀表现的优势,从而通过情感分类,可以做到对证券市场进行情绪监控;第二,针对传统金融时序预测分析面临的不考虑风险而只预测收益率的问题以及无法表达数据特征之间非线性关系的问题,本文将波动率作为风险度量指标,提出Risk-Return模型,同时用长短时记忆神经网络来刻画序列数据特征之间非线性关系,并且通过实验验证了Risk-Return金融时间序列模型的有效性;第三,结合市场情绪数据和金融市场预测模型,将预测结果形成量化策略,并研究其在市场上的表现,结果显示模型预测高收益-低风险的股票准确率达到59.411%,量化策略在市场上取得了优异的13.357%的年化收益率的成绩,并且各项风险指标较低。本文贡献有以下三个方面,第一,针对证券市场上用户评论数据特点提出的Encoder-Decoder+NN的证券市场用户情绪分类算法,证明了方法的有效性,能够做到市场情绪监控;第二,引入长短时记忆神经网络,对金融时间序列预测进行预测,预测结果方面,既考虑收益率又考虑风险值;第三,探索了深度学习与大数据在金融风险领域的实践以及证明了情绪对证券市场的影响并提供测量影响的方法。
其他文献
本文通过对技能型创新人才的内涵和标准进行分析,提出了高职院校培养技能型创新人才的方法与途径,提出为适应现代高职教育人才需求的特点,高职院校必须在教育理念、人才培养
在经济全球化、教育国际化背景下,高职高专中外合作办学为学生管理工作提出了新挑战。本文分析了高职高专中外合作办学学生的特点,并结合上海工商外国语学院中澳合作班的具体
以"校企合作、工学结合"为核心的高职教育人才培养新模式,给高职院校发展学生党员工作、学生党员教育管理带来严峻挑战。高职院校学生党建必须适应新形势,通过与社区、企业合作
<正>当我们在读到《数学趣闻集锦》[1]一文时,我们会看到“数的一种令人惊异的性质”一文,该文的命题是“对任意的一个整数,以你喜欢的任意方式重新排列,则开头的数与新数之
数学思想方法是中学数学教学的重要内容。数学教学的目的不仅要求学生掌握好数学的基础知识和基本技能,还要发展学生的能力,培养他们良好的个性品质和学习习惯,从根本上说这
21世纪.职业教育已经成为我国教育事业的重要组成部分.它已经成为经济社会发展的重要基础和教育工作的战略重点。就英语学习来说,它是一门非常重要的工具课.但是使用传统的教授方
为探讨心电图下壁导联R波切迹对继发孔型房间隔缺损的诊断价值,观察比较继发孔型房间隔缺损30例(Ⅰ组)、其他各类心脏病190例(Ⅱ组)及正常人100例(Ⅲ组)的下壁导联R波切迹及
以数字图书馆为例,从减少信息成本、节约社会资源的角度出发,探讨了一种基于P2P技术的网络教育资源共享模型。