论文部分内容阅读
时间序列是与时间顺序相关的一系列数据序列,时间序列分析就是利用这组数据序列,应用数理统计方法对其进行处理以分析其历史数据模式,或者应用该模式预测未来数据序列的发展。时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测等方面。时间序列分析需要连续的采样点才能更精确的分析其模式,但在实际生活中,由于采样点是由观测数据得来,往往存在稀疏的问题,因此需要用曲线拟合的方法将离散采样点用连续函数估值,将其进行数据补全才能进行更好的分析。本文中主要研究了以上问题的特例:等距离采样时间序列曲线拟合。近几年来,随着我国金融市场的逐步完善,基金已经在我国的投资领域占据了很大的比重,受到广大人民的热切关注。而基金净值作为基金价格变动的直观参考指标,反应了基金公司的总体财务状况。市场上的基金分为开放式基金与封闭式基金,本文主要研究的是封闭式基金,但它只在每周五才公布净值,故在其余时间内为用户提供准确的净值估值对其投资会起到十分重要的参考作用。基金净值估值问题可看作等距离采样的时间序列曲线拟合问题在实际生活中的应用。有关基金净值估值的文献当中,主要分为根据基金公司业绩分析研究基本分析法与依靠统计学理论或人工智能的技术分析方法,本文中结合两种方法使用了组合分析法,首先在基金公司季报中用文本分析方法找出对基金净值产生影响的特征,然后使用统计回归方法训练模型进行估值,同时设定评测标准对估值准确率进行分析。本文主要研究内容包括以下几个方面:1)首先将基金净值估值这个实际问题抽象为等距离采样的时间序列曲线拟合问题,对定期公布净值离散数据用函数插值的方法进行数据补全,为后续基金净值拟合模型提供了连续的训练数据;2)使用了支持向量回归机(SVR)对上述提取出的特征训练模型。在训练过程中调节数据量,调节参数。为了弥补系统过程中的误差,引入了残差分析的概念,通过将历史误差的数据修正对当前模型的估值结果进行数据修正,从而得到了SVR模型在本问题上的最佳实现;3)充分利用期权熵定价理论的优势,总结出基金净值的价格波动可通过其投资产品价格的波动来模拟。借用最大熵思想,对相关市场做了一系列简化假设,得到基于行业组合不变性模型(ME1)与基于投资组合不变性模型(ME2);4)为了对模型估值结果进行更全面的比较,本文引入了六种评测标准,这些评测标准从不同的方面评价根据估值模型得到的净值曲线与真实公布净值曲线的拟合程度,从而为模型对比及改进提供了全面的参照。本文依托于海天园知识服务平台建立了数据获取及验证模块,同时在提取特征过程中也使用了相关文本分析方法。在模型训练过程中通过对SVR模型与ME系列模型对比,最终选择了各项评测指标最优且应用简便的ME2模型,计算得到的基金净值估值结果与其它相关基金数据,本文研究成果亦在海天园知识服务平台网站中显示,并通过数据验证模块不断对其结果进行检验与修正,最终结果经过证明准确率已经达到业内较优水平。