论文部分内容阅读
金融行业的发展使得股票在各方面影响着我们的社会生活,也让股票市场逐渐成为了当今学术界不可忽视的研究领域之一,股价行情预测的相关研究更是得到了广泛的关注。但在一个典型的预测模型中并没有考虑到投资者情绪对模型的影响。为最优化投资策略,本文提出了一种基于社交媒体文本分析的股价趋势短期预测的融合模型,并在此基础上利用模糊控制器设计了一种改进的投资决策模型,该模型可明显提升短期预测模型的准确率及投资决策的收益率。本文工作主要包括以下两个方面:第一,设计了一种基于社交媒体文本分析的股价趋势短期预测模型。现阶段股价趋势短期预测模型主要有基于历史数据的预测模型以及基于投资者情绪的预测模型两大类。在基于投资者情绪的预测模型中,通常采用预先定义的情感分析模块提取预测指标,通过预测指标以及时间序列进行建模,完成股价趋势短期预测。然而由于中文情感分析资源的稀缺,以及股市中的情感倾向与现实社会中的情感倾向的巨大差异,传统的股价趋势短期预测难以达到令人满意的效果。为解决上述问题,本文提出了一种自动标注的方法构建数据集,通过文本分类模型提取文本情感倾向。该模型以天涯论坛股市板块、新浪博客股票类别以及百度股市通中的文本数据为社交媒体文本数据集,以周期为164天的上证指数短期趋势为预测目标进行实验。实验结果表明,该模型比两种传统的股价趋势短期预测模型准确率更高。第二,以模糊控制器为基础,综合利用多种股市数据,建立了改进的投资决策模型。在基本的投资决策模型中,寻找新的决策指标是保证模型长期有效的一个重要步骤。由于投资者情绪在股市预测中极其重要,因此本文在原有经典模型的基础上新增基于社交媒体的指标。为提取该指标,本文使用遗传算法最优化模糊控制规则表,将短期预测结果编码为可用于投资决策的参数IS(k),并利用该参数优化基本的投资决策模型。实验表明,该方法明显优于随机方法,且相较于原始投资决策模型收益率有较大提升,从而证明了通过组合更多的投资决策指标可有效改善模型收益率,以及本文改进策略的有效性。