论文部分内容阅读
时间序列是一个庞大并且复杂的有序数据集合,在时间序列中蕴含了大量潜在有价值的信息和事物的发展规律。如何有效的利用先前的时间序列,发现这些数据背后隐含的规律,是近年来各国学者广泛关注的问题。时间序列数据挖掘能够有效的从大量历史数据中挖掘出有价值的信息。时间序列数据挖掘大部分应用于挖掘那些频繁出现的模式,期望发现其规律,异常数据通常被当做噪声而忽略。尽管异常数据是不经常发生,但往往异常数据能带给人更有价值的信息。在证券时间序列波动建模分析中,突变点或者离群值我们称为证券时间序列的奇异点。因为信息是证券市场上引起价格变动的决定性因素,所以证券时间序列中的奇异点反应了某种信息对证券时间序列的影响。许多数据挖掘算法试图使奇异点的影响最小化,甚至排除它们。但在证券时间序列中,奇异点可能影响时间序列的趋势,也能反映出许多重要特征,同时携带着重要的投资信息。因此能够准确有效的把握这类信息的影响,找出证券时间序列的奇异点与信息之间的关联,对预测股票趋势和股市投资来说都是至关重要的。由于证券时间序列中的奇异点是由信息因素所引起的,所以证券时间序列中的奇异点是证券时间序列中的奇异点是针对证券时间序列的局部而言的。基于密度的奇异点挖掘算法可以对时间序列局部存在的奇异点进行检测且检测精度较高,但这种算法无法直接用于有序的时间序列。本文根据证券时间序列奇异点的特点,采用滑动窗口的对时间序列分割,实现了有效的局部离群点检测。有效市场假说表明市场价格可以充分反映所有可获得的信息。信息在证券市场中被分为利好信息和利空信息,对于同一信息不同的股票会有不同的反应。所以对奇异点方向进行判断,可以更直观的反映出信息对证券时间序列的影响。本文在局部密度检测的基础上提出了一种对奇异点方向的判断方法,通过对实际数据的分析证明该方法的有效性。最后根据奇异点的方向对奇异点进行正向和负向分类,对不同类别奇异点产生后时间序列的趋势进行分析。结果表明奇异点的方向对证券时间的趋势存在影响。