论文部分内容阅读
自证券市场建立以来,作为高收益和高风险并存的股票,一直是众多投资者关注的对象。随着互联网络平台的快速发展,大数据时代到来,传统的股票技术指标数据已不能满足人们分析预测股票价格的需求。本文提出一种基于网络舆情和股票技术指标数据的支持向量机回归模型(NPO-SVM),该模型提高了股票价格的预测精度。模型首先抓取股吧、微博等股评信息,将这些股评观点用支持向量机算法分为看涨、看跌、看平三种股评情感倾向,计算看涨股评观点占看涨股评和看跌股评观点的比例作为网络舆情;然后对网路舆情以及与股票收盘价相关系数在0.6以上的股票技术数据作主成分分析,最后对保留的主成分运用支持向量机回归模型预测。并与基于股票技术指标数据的支持向量机回归模型(TI-SVM)以及基于经验模态分解的支持向量机回归模型(EMD-SVM)作对比,实证分析四只具有代表性的股票,得出NPO-SVM模型比TI-SVM模型、EMD-SVM模型具有更高的预测精度,可为股票投资者提供一种可靠的预测股票价格的方法。本文主要研究工作如下:(1)提出了一种将股评文本信息利用SVM机器学习,实现文本信息情感分类的新方法。该方法能够将海量(日均百万条)文本信息准确分类,测试分类准确率为85.4%。计算文本分类后的网络舆情值,得出网络舆情与股票收盘价之间的相关系数为0.7,说明网络舆情与收盘价之间的相关性较强。(2)提出了一种基于网络舆情和股票技术指标的支持向量机回归模型,对股票收盘价预测。实证分析结果表明,NPO-SVM模型的最大相对误差为2.7%,平均绝对误差为0.092,平均相对误差为0.7%,趋势正确率为76.37%。与TI-SVM模型、EMD-SVM模型相比,NPO-SVM模型的预测精度明显提高。