基于近似信息熵和随机森林的网络安全态势要素提取研究

来源 :网络安全技术与应用 | 被引量 : 0次 | 上传用户:wujun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对态势要素提取问题,提出了一种基于近似信息熵改进随机林的网络安全态势要素提取方法.首先,属性的重要性由近似信息熵约简取得.再使用随机森林分类器对处理后的数据进行分类.最后,为了验证算法的有效性,通过入侵检测数据集测试改进随机森林算法性能.实验结果表明,该算法对比传统随机森林有效地提升了准确率,提高了网络安全态势要素提取水准.
其他文献
在软件工程中实施数据挖掘技术是非常重要的,能够解决在以往软件工程中运行卡顿和错误的问题,网络信息传输能够具备通畅性的特征,在实际工作中需要加强对数据挖掘技术的合理性研究,通过数据的传输以及整合来提高数据最终的处理能力,保证数据准确性以及来源的安全性,推动我国软件工程的稳定发展,因此需要正确地选择数据挖掘技术,为后续的开发提供重要的基础.
针对日志异常检测的传统特征提取方法往往选取一定数量的日志进行特征提取,在程序并发和网络时延波动较大等导致日志顺序混乱的场景下,传统方法效果不够理想.本文提出一种基于二次滑动窗口机制的日志异常检测方法,首先基于正则表达式和日志解析方法提取出日志时间戳和模板信息,再先后两次采用滑动窗口方法获取特征提取的序列对象.其中初次滑动窗口基于日志数量进行定长滑动,二次滑动窗口基于时间间隔进行变长滑动,以此优化特征提取粒度,有效筛选出时空关联性较强的日志集合.最后基于长短期记忆网络LSTM搭建判别模型解决异常日志的多分类
分层技术是计算机软件开发中应用的一个重要技术内容,通过该技术手段与技术特点可以实现对技术功能的利用与发挥,进而基于其优势特点增强对不同技术的应用效果,降低软件设计开发的成本,提高软件的开发效率与使用寿命,强化各个功能之间的关联性.本文就着重针对分层技术在计算机软件开发中的应用进行探讨分析,明确不同类别的分层结构技术以及相关领域的技术在计算机软件创新领域中的实践应用,进一步提高分层技术的效果与意义.
随着国民经济水平的飞速发展,家长对于孩子的教育越来越重视.由于现在的教育信息化的发展,云计算、大数据、物联网等技术的完善成熟,各个学校的教育硬件资源越来越丰富,可在考试方面,普通的学校和老师无法完全使用答题卡进行考试,大量的阅卷无法避免,教师费神劳力却不能得到解决.本文对拍照实现答题卡图像的采集,对图像的识别流程、图像预处理中的对比度处理、图像滤波、灰度化以及二值化进行研究和实现.其次,对答题卡图像的校正进行重点研究,使用Hough变化、Radon变化、最长直线方程三种方法对倾斜的答题卡图像进行校正.
本文基于笔者数年以来的软件工程实践经验,详细分析讨论了软件项目管理中的各个组成部分.分析了软件开发过程中的各个阶段,从需求分析到系统的设计与实现,再到软件的测试与后期维护,建立了完整的开发流程管理;分析了团队管理中对于时间的安排和对项目成员的管理,有助于项目团队更好地开发软件;分析了软件开发中的各种风险,并给出了预防措施,有效提高了软件开发的成功率.在网络发展关键时刻的今天,本文将更有助于软件的高效开发.
针对大部分恶意代码检测技术在检测时存在检测精度与实时性、鲁棒性之间的矛盾,提出基于TensorFlowOnSpark分布式平台的恶意代码检测方法.在TensorFlowOnSpark平台上二次开发,运用RNN+LSTM提取有效特征,利用CNN完成分类检测,改善了恶意代码检测时的实时性和精度,增强了检测效果的鲁棒性.实验对比结果显示:与其他检测方法相比,该方法检测效果大幅提升并且可行性好,减少检测时间约6分钟,提升检测效果超过40%.
随机搜索法是对无约束力问题寻找最优解的一种算法.随机森林是一种集成算法,为了提高随机森林分类的准确率,需要对参数进行调参.随机森林可以通过网格搜索算法或学习曲线算法选取到合适的参数,但是训练时间过长,消耗资源过大.本文通过对随机搜索算法改进,利用改进的随机搜索算法优化随机森林调参.经过实验验证,改进的算法选取到的参数保证了随机森林分类准确率的同时,相较于通过学习曲线算法缩短了约百分之六十的调参时间.
本文结合威胁情报系统的设计、开发和运维经验,系统研究了流式数据处理、交互式数据分析、数据湖以及分布式数据处理等大数据技术在威胁情报系统中的应用.分析和总结了在威胁情报系统建设场景中,大数据技术的选择、大数据产品的选型以及大数据平台的设计,为基于大数据技术的应用系统的设计和开发提供参考.
在信息技术发展速度逐渐加快的背景下,计算机软件在人们日常生活中得到了广泛的运用,软件创新研发得到了人们的重视.在此背景下,人们的工作、生活方式发生了巨大的转变,加强了科技感.在计算机软件开发方面,分层技术为其提供了强大的技术支持,能够有效地解决软件开发过程出现的缺陷问题,充分发挥出软件功能,不断提高经济效益,促进社会的发展.
高斯混合模型是一种含隐变量的概率图模型,其参数通常由EM算法迭代训练得到.本文在简单推导高斯混合模型的EM算法后,将使用高斯混合模型对鸢尾花(iris)数据集进行分类判别.同时,针对EM算法受初始值影响大的问题,使用了K均值聚类算法作为其初始值的估计方法.在得到K均值聚类算法和EM算法的分类判别结果后,对比两种算法的判别准确率,以此说明在初始值合适的条件下,基于EM算法的高斯混合模型具有较高的准确率.最后文章分析指出了当前EM算法的两个局限性:易受初始值影响和维度灾难.