【摘 要】
:
在网络恶意流量识别任务中,存在恶意流量样本数量与正常流量样本比例不平衡问题,从而导致训练出的机器学习模型泛化能力差、识别准确率低。解决恶意流量分类中遇到的数据集不平衡问题能够有效高分类模型的学习效果,从而达到准确分类少数流量样本的目的。越来越多的研究者在数据层面进行研究,以高数据利用效率,多样化的特征表示形式应运而生,这其中就包括利用源数据构造图像的数据表示方法,这给恶意流量分类领域开拓了疆土,使
论文部分内容阅读
在网络恶意流量识别任务中,存在恶意流量样本数量与正常流量样本比例不平衡问题,从而导致训练出的机器学习模型泛化能力差、识别准确率低。解决恶意流量分类中遇到的数据集不平衡问题能够有效高分类模型的学习效果,从而达到准确分类少数流量样本的目的。越来越多的研究者在数据层面进行研究,以高数据利用效率,多样化的特征表示形式应运而生,这其中就包括利用源数据构造图像的数据表示方法,这给恶意流量分类领域开拓了疆土,使更多图像识别领域的优秀模型可以完美迁移到流量分类领域。随着生成对抗网络(Generative Adversarial Networks,GAN)被广泛应用于各个领域来实现数据生成,其强大的生成能力和以全局分布信息为生成基础的特点很好地契合恶意流量领域数据生成的目标。将其应用到恶意流量分类领域,对解决不平衡数据分类问题意义重大。针对以上问题,本文进行如下研究:(1)研究了一种基于Wasserstein GAN(WGAN)的不平衡网络流量分类方法。在原始流量数据包进行图片化的基础上出一种利用WGAN生成网络对抗生成的方式,实现少量数据类的扩充,从而解决数据不平衡问题。首先,通过数据预处理将数据集中原始流量PCAP数据按照流为单位进行切分、填充、映射到灰度图片中;然后,使用传统随机上采样、WGAN对抗网络生成技术、普通GAN生成技术实现数据集的平衡;最后,使用公开数据集USTC-TFC2016和CIC-IDS2017在经典深度卷积神经网络模型(Convolutional Neural Network,CNN)上对不平衡数据集和平衡后的数据集进行分类测试,利用precision、recall、f1三个评价指标来评价分类效果。实验结果表明,使用WGAN模型进行平衡的数据集在相同的分类模型下分类效果优于普通的GAN生成方法和传统上采样方法。(2)针对WGAN依然存在的训练不稳定和只能生成单一类别数据的问题,出一种基于具有梯度惩罚项的条件Wasserstein生成对抗网络(CWGAN-GP)的不平衡网络流量分类方法,其创新性的将CWGAN-GP模型与流量图片化进行结合来处理网络流量不平衡分类问题。很好地解决WGAN存在的效率不高和生成单一类别数据问题。同样的,首先利用流量图片化方法进行数据处理,然后将所有类别数据使用该方法进行平衡处理,最后利用公开数据集在深度模型CNN上进行分类实验,验证了所出的基于CWGAN-GP的不平衡网络流量分类方法可行性。同时与基于传统过采样平衡的分类方法进行对比,结果表明了本文方法在Precision、Recall、F1三个指标均高于其他对比方法,F1值高近3%,时间消耗减少明显。
其他文献
房地产行业是推动我国经济发展的支柱行业之一,它带动着上下游诸多产业的发展。但是自2017年以来,国家开始对房地产行业进行大幅度的政策调控,导致房地产企业运营成本急剧上升、利润进一步下降、行业竞争日趋激烈,房地产市场由增量市场转而进入存量市场。2020年为进一步深化改革,防止系统性风险的发生,央行针对房企新增借款出台了三道“红线”,这使得房地产企业融资更加困难,多年来稳居房地产行业榜首的恒大也出现了
随着世界经济的快速发展以及贸易的自由化,国际投资协定逐渐开始显现出弊端。一方面,国际投资协定的主要目标是保护投资者的投资利益,但在此过程中投资东道国内的环境遭到了破坏,使投资东道国与投资者之间产生争端;另一方面,可持续发展理念持续深入发展,全球性环境问题不断涌现,国际社会对环境保护问题的关切日趋凸显。为了协调国际投资和环境保护之间的关系,各国也在不断尝试在二者之间找到平衡点。该篇论文将从典型的国际
民事诉讼已经成为我国民众解决纠纷、维护自身合法权益的途径,但众多的民事诉讼中存在着虚假的民事诉讼。民事虚假诉讼问题的出现和频发,不仅破坏了社会诚信体系建设,侵害国家、社会、他人的合法权益,浪费了司法资源,损害了司法权威。其具体表现形式是当事人通过“单方故意”或“双方恶意串通”的方式,捏造事实、虚构民事法律关系,向人民法院提起民事诉讼,以达到利用合法诉讼程序来谋取非法利益的目的。近年来,以最高人民检
在实际教学过程中,笔者发现学生在解数学应用题时,出错率较高,并且不同的学生对不同类型的应用题所犯的错误也各不相同.前人对数学应用题解题的研究主要集中在小学应用题上,对高中数学应用题解题的研究较少.本研究主要对高中数学应用题解题尚未研究过的一些问题进行研究.本研究主要采取文献分析和调查研究的方法.首先从文献中筛选出有关数学应用题解题和教学的相关文章,归纳总结出当今数学应用题解题现状;其次选取菏泽某高
英语写作是英语学习的五大基本技能之一,是学生语言能力的综合体现,对学生英语能力的发展起着重要的作用。而写作评价是影响写作教学的重要因素。传统的教师评价耗时低效,不能提高学生的写作积极性和写作自主性。而文秋芳教授基于产品导向法提出的师生合作评价是一种新的评价方法,旨在解决耗时、低效的问题。虽然师生合作评价是为产出导向法而设计的,但它的基本概念和实践也可以应用于评价其他教学方法的书面产出和口头产出。在
本翻译报告的原文节选自作家尼古拉·卢季诺夫(НиколайАлексеевичЛугинов)所著的小说《变换的时轮》(Времяперемен)。在这部作品中,作者续写了中国与匈奴帝国在公元前五世纪至公元前三世纪之间的复杂关系,提出了善与恶、精神与物质、义务与利益、勇气与怯懦等永恒对立的问题。本翻译报告由以下五个部分组成:摘要、正文的三个章节、参考文献、附录和致谢。正文第一章是翻译任务及翻译过程
英语阅读在初中英语教学中占着很大的比重,但是现在的初中英语阅读教学课堂中一些教师的授课方式还停留在单词、语法等表层上,教师们过于希望学生通过学习英语知识提高英语成绩,却忽略通过传授学生们如何学习英语的方法,因此学生们无法从原来的被动接受知识转变成自主学习、吸收知识。本文是以语篇分析为基础,将语篇分析融合到初中英语阅读教学课堂之中,从宏观和微观两个层面对学生进行英语阅读教学。本文主要研究以下两个研究
在二语写作教学中,教师反馈是提高学生写作能力的重要手段。不同的反馈策略有着不同的效果。同时教师的书面反馈既是他们教学责任之一,又是对于课堂教学的有效补充。但国内的研究大多数都集中在大学和高中阶段的学生对教师反馈的反应上,而对初中生的反馈偏好关注相对较少。并且有的研究只关注一个或几个语言错误,生态效度低,与实际作文批改情况也不符。鉴于此,本文研究关注所有的语言错误,并考虑学习者的动机因素进一步探究更
随着科技的迅猛发展,人工智能技术被广泛运用在人们的日常生活和生产中。2017年以来,中国已将发展人工智能技术列为重要战略目标之一。放眼世界,为了将欧洲变成值得全球信赖的人工智能中心,以加强整个欧盟范围内对于人工智能的使用、投资和创新,欧盟委员会于2021年4月21日通过了《人工智能法》提案,旨在建立关于人工智能技术的统一规则。国内外不少学者认为随着强人工智能时代的到来,与之相伴的诸多法律问题也会产
主动型侦查由来已久,而结合新的通讯、传感器和计算技术,给予了主动型侦查新的手段和内涵。从电子证据的角度讲,第三代电子证据,即数据证据正在不断完善且应用于司法实践中,因而新的技术条件下的主动型侦查在侦查活动中,更侧重于搜集第三代电子证据,通过数据的搜集结合大数据技术又可以作为预测性侦查提供有力的支撑。而在新的第三代电子证据面前,传统的回溯型侦查已经显得较为乏力,尤其是涉及需要搜集线上的线索及证据时,