论文部分内容阅读
互联网时代,股市投资者获取金融市场信息、进行股票交易和交流等活动几乎都是通过互联网进行的。其中,股吧、论坛等网络平台聚集了大量个人投资者和机构投资者,他们会在这些网络平台发表对股市或者某只股票走势的看法,也会相互评论进行交流。行为金融学认为,人的决策行为是不理性的、且容易受到所处环境的影响,这也为股市投资研究提供了新的视角:通过研究股吧、论坛等网络平台的舆情来探究其对股市、投资的影响。本文使用机器学习中的支持向量机算法(SVM)构建基于网络舆情的量化选股模型,对网络舆情因子指标是否对量化选股模型的选股能力有影响来展开研究。首先,利用网络爬虫对2017年8月至2018年8月沪深300成分股的在线股评文本进行采集,对采集的股评文本进行情感分析后,计算出网络舆情因子值。然后,将网络舆情因子与通过有效性因子检验的7个基本面因子和技术面因子相结合,使用前3个月因子数据优化多因子量化选股模型的参数,并使用后9个月的因子数据进行回测,对比加入与未加入网络舆情因子的量化选股模型回测结果显示:(1)在回测期间,基于网络舆情的量化选股模型获得了8.07%的超额收益(基准为沪深300指数),而同期未加入网络舆情的量化选股模型的超额收益为5.47%(基准为沪深300指数)。(2)加入网络舆情的量化选股模型较未加入网络舆情的量化选股模型而言,最大回撤率降低了1.78%,获得了更稳定的回测收益。(3)对比了未加入网络舆情的量化选股模型,加入了网络舆情的量化选股模型在Alpha值、日胜率、IR值等回测评价指标上表现更好,有效提升了模型的选股能力。研究发现,股市行情与投资者情感之间存在联系,网络舆情因子是影响模型选股能力的重要因子,对网络舆情的研究不仅可以有效的提高量化选股模型的选股能力,还可以为新的量化选股因子的选择提供理论支持。