论文部分内容阅读
计算机已深入到社会的各个领域,网络信息已成了人们不可或缺的信息源,但其非结构化、来源分散等特点使得深层网络信息处理技术发展缓慢;同时,人们还拥有采用结构化存储的量化数据,与网络信息相比,其具有结构化、精确化、来源稳定等特点。目前,这两个领域的研究还处于相互独立的状态,由于量化数据的精确性,使它在重要的时间序列预测中起到决定性作用,但单纯基于结构化数据的时间序列预测模型很难预测到在互联网上发布的各种事件或消息对时间序列的突变性影响,作为一种探索,本文尝试着将这两类独立的信息进行融合。论文的第一个工作是研究了基于ERBF核函数的SVM分类器在金融时间序列预测中的应用。为了对股市走势进行分类,我们的难点主要是如何选择股票历史信息的数据特征长度和核函数。通过核函数把原始空间中的特征映射到高维空间,进行线性分类。最终通过选取4天股票技术分析数据特征和ERBF核函数,构造了一个优于同类预测算法的分类器。在此基础上,本文研究了把特殊事件的信息影响如何应用到股市预测中。由于金融市场非常复杂多变,结构化的时间序列预测很难对特殊事件做出反映。本文基于事件影响度分类的方法,对事件进行了分类,并计算出事件的置信度,根据置信度,结合结构化的时间序列预测,建立了基于信息影响度计算的金融时间序列预测,以应对结构化时间序列预测对网络事件影响无法计算的不足。最后,本文通过大量的实验来验证了上述方法的效果。实验结果表明,基于ERBF核函数SVM的分类器对结构化的金融时间序列走势预测准确率达到58.9%优于其他的同类方法,对基于特殊事件的金融时间序列预测准确率高达75.3%,达到预期效果。