论文部分内容阅读
网络测量是了解网络性能、揭示网络运行规律的重要手段。随着网络技术的飞速发展和互联网业务应用的不断涌现,对网络通信可靠性的依赖越来越强。然而,现有的网络服务质量与用户的期望还存在着较大的差距,因而通过网络测量的手段了解网络运行状况,对网络性能进行测量与分析变得尤为重要。在已有的网络测量研究中,研究者通过主动或被动测量的方式测量网络相关指标,包括端到端时延、带宽、丢包率以及拓扑结构等,然而他们很多都没有挖掘这些服务异常参数之间的关系。本课题选取了互联网业务应用中最常见的网站服务作为研究切入对象,旨在挖掘不同网站的服务在网络层面异常的相关性,建立网站域名时延异常检测模型。为了建立上述模型并进行验证,主要分为数据集的采集部分、模型的构建与模型的实验验证三个部分。首先,对Alexa排行榜前100的网站进行关键域名解析,并进行为期一个月的网络性能测量,包括时延、丢包率和拓扑等。通过对网站域名的DNS解析,分析提取解析后的域名后缀并进行分类,确定网站域名使用的具体内容分发网络服务。其次,基于iForest算法对网站服务的关键域名网络层时延进行异常检测,随后对时延异常进行聚类分析,基于DBSCAN算法聚类结果构建网站域名时延异常检测模型。最后,将实际测量数据应用到网站域名时延异常检测模型中,验证了模型的有效性。域名时延异常聚类结果的平均AUC达到0.762,同类域名在内容分发网络服务、丢包率或拓扑上也存在着相似性,通过部分网站域名的时延异常情况能快速推测其余同类网站域名的时延异常情况。