论文部分内容阅读
随着社会经济和互联网的发展,中国金融市场迎来了空前的繁荣,投资者在面对机遇的同时,也伴随着诸多的挑战和风险。千万级的股民数量,2500多支A股以及便捷的股票交易方式使得每个交易日产生的交易数据都很庞大,而且每日与金融相关的新闻资讯也在网络上不断更新,股民使用原始的投资手段已经难以应付如此大量的数据信息。因此,结合了数理统计和计算机技术的量化交易对解决上述问题具有重要的意义和价值,引起了研究人员广泛的关注。本文构建了一个提供给投资者进行算法研究的面向量化交易的金融数据处理平台,旨在提供给用户有效的金融数据处理工具,并在该平台基础之上实现了三个可行的策略思路供算法研究员参考。本文首先对量化交易的国内外发展现状进行了总结,并对现有的量化交易手段进行了研究和分析,研究了时间序列分析法以及文本分析法在量化交易中的应用。然后针对金融数据处理平台的实际需求进行了详细的需求分析,据此设计出了系统的整体架构,分解出了辅助功能模块和算法实体模块,分别对其关键功能进行详细的设计。最后实现了具有多个工具的金融数据处理平台,本文的工作量主要在以下四个方面:(1)在辅助功能模块中实现了四种金融数据处理工具。一是使用网络爬虫获取金融相关的新闻数据;二是使用Node.js的Addons技术改进了股票交易数据获取平台;三是实现了能在任何历史时刻进行交易模拟的程序;四是基于eCharts.js技术实现了平台的可视化分析与呈现。(2)在基于文本处理的策略模块里提出了基于TF-IDF的朴素贝叶斯模型的新闻情感倾向预测;并使用情感词典来量化股评,将结果作为量化择时特征数据的一部分。(3)在量化选股模块里提出了基于多项式线性回归模型的多因子策略来实现量化选股,该策略根据历史股票交易数据、基本面数据以及衡量系统风险的?值来推荐股票组合。(4)在量化择时模块里,本文从情绪指标、市场前期走势、经济指标、货币环境这四个方面提取出数据特征,并使用支持向量机作为训练模型。