论文部分内容阅读
股评情感分析是通过计算机技术自动地分析出股评的情感信息,对股评的情感倾向性做出分类判断。股票市场的变化会影响到投资者的心情变化,越来越多的投资者更倾向于在金融网站上发表含有感情倾向的评论,这些评论会反作用于股票市场。投资者在进行投资时,获得有用的股评信息对投资者具有非常大的帮助,因此研究股评的情感倾向具有实际应用意义。股评是非结构化的文本数据,计算机无法直接计算,使用传统的向量表达模型往往会出现无法区分表达多义词的问题,基于深度学习的股评情感分析算法研究大多数是基于单一神经网络的,但单一神经网络存在局限性的问题,单靠人工识别和操作庞大的股评信息量会耗时耗力。因此本文针对以上存在的问题展开以下主要研究:1)设计了股评情感倾向数据集。由于目前没有公开的股评情感数据集,受应用需求所迫,设计了面向股评的情感倾向数据集。首先选取数据来源的金融网站,其次编写爬虫程序爬取股评数据,然后经数据预处理得到数据集,最后标注数据。2)研究了文本语言模型。研究对比了TF-IDF、Word2Vec、BERT以及XLNET语言模型的优缺点,本文首次将XLNET语言模型引入到了金融领域。XLNET语言模型可以解决多义词无法区分表示的问题。3)提出了基于混合神经网络的股评情感分析模型。针对单一神经网络无法同时兼备提取股评短文本中的语义和语序信息的能力、捕获双向的语义特征的能力以及突出关键特征重要程度的能力,本文提出了基于混合神经网络的股评情感分析模型。该模型首先利用XLNET语言模型生成文本向量,其次使用双向长短时记忆网络提取双向语义信息,然后在卷积神经网络中,使用3种不同的卷积核和最大池化函数提取特征,最后又引入了注意力机制进行股评情感倾向性识别。实验结果表明,在准确率、召回率、F1值等评估指标上,基于混合神经网络的情感分析模型均优于单一神经网络的情感分析模型。4)设计并实现了一个股评情感分析系统。本文将提出的基于混合神经网络的股评情感分析模型应用到实际开发中,以直观的形式展示给证券投资者,为证券投资者投资决策时起到了一定的辅助作用。