流式计算环境下网络流量异常检测技术

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:x_schen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展、带宽的增长,网络本身和网络攻击手段都在不断演变,异常检测相关算法和系统在精度、时效性、效率等方面都面临挑战。目前大数据处理平台的网络异常流量检测方案大多以Hadoop数据处理平台为载体,考虑在集群上部署Hadoop数据处理平台,使用各种机器学习算法对采集到的流量数据进行大规模的离线计算,并没有考虑异常流量检测的实时性,难以满足实时检测反馈异常流量的要求;同时相关检测算法存在优化升级空间,可以进一步优化以适应大数据的分布式处理方式;除此以外,一种机器学习算法生成的检测模型存在有效性的问题,并不能一直适应持续不断变化的网络环境。针对上述问题,本文做了以下工作:(1)提出了一种基于单点密度和距离的初始聚类中心选择算法。分析了现有的基于无监督聚类算法K-均值算法的核心思想和算法流程,针对算法对初始聚类中心敏感的问题,提出了一种基于单点密度和距离的初始聚类中心选择算法,减少K-均值算法迭代次数,防止其陷入局部最优,并提高检测率。(2)提出了一种自适应更新检测模型的方法。使模型不再有时限性,能随网络流量特征变化而变化,能适应不断变化的网络环境。(3)设计并实现了基于Spark的网络流量异常检测系统。将网络流量异常检测系统在流式计算平台Spark进行设计和实现,系统分为预处理模块、检测模型生成模块、异常流量识别模块和模型更新模块等。将改进的异常流量检测算法应用在检测模型生成中,将自适应更新检测模型的方法应用在模型更新模块中,使异常检测系统可以进行在线的实时检测,效率提高。最后对系统的效率、准确性进行了实验分析。
其他文献
近几十年,科学技术得到了飞速发展,这些先进的科学技术融入到了人们的生产、生活、工作、学习中,同时产生了一些新兴的微事物,例如微博、微信、微电影等。短小精悍的微课在这
桂中坳陷是在加里东运动基础上形成的晚古生代海相大型沉积坳陷,已演化成为由上古生界和三叠系充填的残留盆地,其中泥盆系深埋地腹,是主要的勘探目的层系。桂中1井揭示泥盆系
本文将借助"奥卡姆剃刀"这一古老的哲学命题作为解释的工具,从宏观上对乔姆斯基"最简单主义"方案的哲学渊源作一探讨,尤其是"最简单主义"所秉承的"经济性原则"。希望本文可以
目的:探索慢性胃炎中医证型与胃镜像分布规律及两者之间的关系,从微观领域证明中医宏观辨证论治的科学性,完善其中医辨证理论体系,为慢性胃炎的临床诊断、治疗及科研提供更多
互联网把未成年人带入了更加新奇和复杂的成长环境,也增加了预防未成年人犯罪的困难性。当前网络已经成为未成年人犯罪的重要诱发因素,网络犯罪是未成年人犯罪的新的增长点。
风险投资,作为一个行业,在我国已经历三十多年从无到有的发展过程。目前,中国已经成长壮大为全球第二大风险投资市场。伴随我国市场经济发展和国民经济结构的转型升级,风险投
观察、试验的结果表明 ,发生在桉树幼林的梢枯病 ,是由于缺乏微量元素硼而引起的一种生理性病害。它造成桉树枝梢顶端枯死 ,影响植株的生长与干形。在广西已有多处桉树种植区
网络异常通常利用流量特征的变化来表达,因此,基于特征统计分析的异常流量检测方法是入侵检测领域的一个重要研究课题。当前基于特征统计分析的异常检测方法主要存在两个问题:(1
考古调查和初步试掘表明,江苏无锡杨家遗址是太湖流域北部一处以马家浜文化晚期(6270~5920cal.a BP)堆积为主体的新石器时代遗址.为了解太湖北部史前遗址的植被景观、环境特