论文部分内容阅读
随着计算机网络技术的发展,网络用户数飞速增长,网络的规模及网络的性能得到了较大程度的提升,网络复杂性不断的提高,这些对网络行为的研究提出了新的挑战。在错综复杂的高速网络环境下了解不同层次用户的网络行为特征对于网络规划、网络安全等领域具有重要意义。网络流量测度,作为刻画网络用户行为的基础,重要性日益显现。当前提出的网络流量流量测度种类繁多,各自有针对性的从不同的侧面反映了网络用户的行为特征。如何理顺众多测度之间的关系,进而为测度的进一步应用提供支持,逐渐成为网络行为学研究的一个重要研究领域。
论文以网络流量测度的应用为研究背景,结合CERNET华东北地区网络中心“网络行为观测系统”的现实需求,对网络流量测度的相关性展开了研究。运用多元统计分析中的因子分析方法,除去网络流量测度之间的相关信息,从多个流量测度中提取出最能反映流量行为特征的少数互不相关的“关键因子”,达到了理清测度间关系的目的。论文在相关性分析的基础上,针对流量测度应用中的两类重要问题--分类及近实时预测--展开了进一步的研究,提出了网络流量行为特征的分类方法以及用于近实时网络流量测度预测的自适应预测算法。
论文首先介绍了网络流量测度研究的相关背景。提出了以理顺网络流量测度的相互关系,为流量测度的进一步应用提供支持的研究目标。确立了以因子分析、聚类分析的方法进行测度的相关性研究;以ARIMA模型为基础,通过添加自适应调节功能完成近实时预测算法的技术路线。
然后,对论文研究的对象进行了定义,并基于现实环境完成了流量测度的获取过程。本部分从集合论及原子测度的角度,借鉴现有测度的定义原则,对网络流量测度进行了严格定义;针对现有的网络环境,设计实现了基于NetFlow的网络流量测度采集计算模块,为后续的测度研究奠定了基础。
接着,论文运用因子分析的方法对网络流量测度进行相关性分析,经过对15个流量测度的因子分析,提取出“活跃因子”,“流量因子”、“负载因子”,“角色因子”等相互不相关的“关键因子”,这些少数的因子能够比较全面的反映出网络流量行为状况。通过因子分析达到了理顺测度间关系,精简测度的目的。
随后,在相关性分析的基础上,进一步针对流量测度应用中的测度分类及测度近实时预测问题进行了研究。通过聚类分析的方法完成了对特定时间段用户流量特征的分类以及特定用户不同时间段流量特征的分类,通过总结类的特征,增强了网络流量行为的区分能力;近实时预测部分在ARIMA模型的基础上,分析近实时预测的特点,设计了网络流量测度自适应预测算法,并对算法中涉及的预测数据集尺寸、预测更新策略等关键问题进行了深入的分析讨论。
最后,总结了论文的研究工作,对未来进一步的测度研究及应用进行了展望。