【摘 要】
:
传统机器学习模型在网络入侵检测方面存在识别率低等问题,为了进一步提升检测率,主要应用Boosting集成学习算法进行相关的检测和研究,同时通过随机森林法来针对关键特征予以提取,构建多类分类器模型,同时借助KDD99数据来针对试验予以验证.实验结果表明Boosting集成学习算法能够较好的识别攻击类型数据.改进的GDBT,Xgboost相比随机森林效果较好,整体的准确率和召回率相比较优,表现出较高的预测精度.
【机 构】
:
中国民用航空飞行学院计算机学院,广汉 618307
论文部分内容阅读
传统机器学习模型在网络入侵检测方面存在识别率低等问题,为了进一步提升检测率,主要应用Boosting集成学习算法进行相关的检测和研究,同时通过随机森林法来针对关键特征予以提取,构建多类分类器模型,同时借助KDD99数据来针对试验予以验证.实验结果表明Boosting集成学习算法能够较好的识别攻击类型数据.改进的GDBT,Xgboost相比随机森林效果较好,整体的准确率和召回率相比较优,表现出较高的预测精度.
其他文献
支架设计是现浇箱梁施工中的关键技术,依托高速公路项目情况,分别对抱箍法、穿心棒法及抱箍承托穿心棒法进行了详细分析,并总结出在同等条件下各种方法的优缺点,以便为类似工程选择合适的方法提供帮助.
旨在研究新冠肺炎疫情对国内和国际油市所造成的影响,为我国在医疗卫生突发事件下的油价政策调整提供参考依据.研究采用ESW模型和VAR模型,实证分析了疫情对国内油价及国际油价的影响.结果发现市场主导下的国际油价受到的冲击远超政府主导下的国内油价,政府主导型油价抗风险能力强、恢复能力高,市场主导型油价面对风险时波动较大且较难恢复,最后得到相关启示.
数据失衡对信用风险评估模型的性能构成挑战,为了提高金融机构的风险控制能力,针对信用风险数据的不平衡现象,提出了一种基于ADASYN-AdaBoost-CNN的集成模型.首先采用ADASYN技术平衡数据集,减轻不平衡现象对信用风险评估的影响.其次构建基于卷积神经网络的集成学习算法,确保信用风险评估模型的准确性与鲁棒性.最后在lending club借贷数据集上开展实验,使用F1-measure、G-mean和AUC三个评价指标检验模型性能.结果表明,ADASYN-AdaBoost-CNN模型能够有效解决不平
分析用户网络行为,识别诈骗网站,对电信网络诈骗犯罪的防控工作具有重要的实际意义.本文通过研究用户的多步骤、时序性的网络数据流,提取显性流量特征以及隐性网络行为特征,建立基于BP神经网络的诈骗网站识别模型,实现对诈骗网站的动态识别.为解决传统的诈骗网站检测模型精确度不足、模型开销庞大的问题,以及传统BP神经网络模型容易陷入局部最优解的问题,本文提出遗传算法优化的BP神经网络模型,通过遗传算法寻找最佳初始权阈值,优化神经网络模型.在用户网络行为数据集的基础上进行实验,证明模型能够有效识别网站的诈骗属性,具有实
基于大规模文本语料库的预先训练模型能够学习通用语义表征,再根据给定数据集进行微调可以显著提升预先训练模型在各类自然语言处理任务的性能.在这种“预先训练模型+微调策略”的模式下,数据特征来源的选择、模型速率的提升、微调策略的设计就显得尤为重要.本文重点介绍强力优化的语义表征模型RoBERTa、基于全词遮蔽的扩展模型RoBERTa-wwm-ext和基于知识蒸馏的压缩模型RBT3等预先训练模型,以及判别微调DF和倾斜的三角学习率STLR等微调策略.在公众留言分类实验中表明,相对仅选取“主题”作为数据特征来源,选
针对粒子群算法求解问题时易早熟收敛,精度不高等问题,提出了具备预判能力和向最小距离学习的粒子群算法(MDPSO).该算法中粒子的社会学习部分是从各个粒子的个体极值中提取有效信息进行学习,首先粒子对所有粒子的个体极值(包括自己)的信息进行分析,确保下一次寻优过程中向正确的方向飞行,即预判能力,防止了粒子向错误方向飞行而浪费太多时间;其次,粒子从预判的方向上选取一个最小距离来指导粒子社会部分的学习,使粒子较快的收敛到下一代较好食物的位置.最后,结合两策略的特点,可以有效的防止算法早熟收敛并提高其精度.MDPS
网络用户数量随着大数据时代的发展逐年增加,我国网络普及率高达60%,网民数量有8.29亿.各项资源呈现高度的信息化,伴随而来的问题是用户信息泄露,信息资源被盗用,网络安全问题日益严重等.针对网上的恶意代码,入侵检测成为一项新的热点,由于老式的检测技术依赖于大量的人力,并且时效性和对未知访问技术的防御较弱,因此在新式的检测系统中会采用更加高效的算法,例如支持向量机(SVM),将SVM引入到检测系统形成一个自动化的系统,用公开权威的数据集KDD99对其进行仿真实验,交叉验证进行模型调参,寻找能得到最优结果的最
医疗分类问题作为数据挖掘在医学上的重要问题分支,旨在通过人工智能算法构建出分类决策模型以辅助临床诊断.为改善医疗分类模型的泛化能力,利用受限玻尔兹曼机有效的特征提取性能,提出一种改进回归权的深度置信网络结构并将其应用于医疗数据分类问题研究中.在三个UCI医疗数据集上分别基于改进网络构建出决策模型,并与原始网络结构进行对比.仿真结果表明,基于改进深度置信网络构建的决策模型取得了较为优异的性能.
投资者在选择投资策略时一般会权衡收益与风险的利弊,综合各方面考虑,得出最合理的投资方案.本文研究了一种层次分析-熵权法模型用于投资组合构造.通过构建所选取部分股的层次分析模型,对数据进行定性定量赋权,得到投资比例.在此基础上结合熵权法,进一步权衡收益和风险,更加客观对投资权重进行修正.并用夏普比率对模型进行评估.
在电子政务工程项目的建设中,数据规范是数据整合、共享、交换和应用的基础,也是保障数据质量的必要约束.针对全国公共资源交易数据由地市、省到国家,级联式汇聚整合的模式,以及公共资源交易主管部门数据横向对接汇聚的工程需求,结合业务层面交易的统计、分析和数据共享需求,总结了公共资源交易平台数据规范的结构设计、内容设计和难点所在.在跟踪数据规范推广应用的实际进展基础上,提出后期的修订方向.