基于多目标进化优化算法与随机森林的网络钓鱼检测研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:ziquan33071033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钓鱼攻击已成为人们日常网络环境面临的重大威胁。钓鱼攻击者伪装可信网站骗取用户信任,窃取用户敏感数据,使得用户造成损失。因此,需要一种有效的方法来防止网络钓鱼攻击对人们造成持续的损失。网络钓鱼检测系统广泛应用机器学习模型对海量钓鱼数据集进行分类。基于经验,研究人员倾向于提取尽可能多的特征来提高网络钓鱼检测性能。然而,特征集中的冗余特征和无用特征会降低底层分类模型的性能。与此同时,现有的钓鱼检测模型大多只关注检测的准确率,对召回率的重视不够。然而,在钓鱼检测中将钓鱼网站检测为合法网站比将合法网站检测为钓鱼网站危害更大。本文提出了一种基于改进的多目标进化优化算法MOE和随机森林RF的网络钓鱼检测模型MOE/RF。MOE/RF模型不仅将准确率作为检测目标,而且将钓鱼网站检测为合法网站的误检概率最小化。同时,本文提出了基于对称不确定性的种群初始化和基于种群状态的自适应环境选择两种新策略来提高MOE算法的性能。实验结果表明,本文提出的模型相比现有的许多方法具有更高的性能。本文主要的工作如下:1)将多目标进化优化算法应用于钓鱼检测。传统钓鱼检测方法总是会忽略将钓鱼网站误检为合法网站的危害性,往往仅着眼于模型准确度的提高。在MOE/RF模型中,我们不仅考虑模型的准确率,也最大限度降低将非法网站误检为合法网站的概率,提升模型的性能。2)设计基于对称不确定性的种群初始化策略。MOE/RF模型中以对称不确定性作为衡量钓鱼特征重要性的指标,它能够评估单个特征与网站标签之间的相关性。与随机种群初始化策略相比,种群初始化过程中利用SU先验知识能够有效避免MOE的无效搜索。3)设计基于种群状态的自适应环境选择策略。该策略根据非支配个体的分布将在进化过程中的种群划分为三种状态,在新定义的三种状态的基础上提出了自适应环境选择策略,即对不同的种群状态采用不同的选解策略。实验证明该策略保证了模型的收敛性和多样性。4)采用随机森林作为基础分类器以及将本文设计的模型MOE/RF与最新的钓鱼检测模型和传统的钓鱼检测模型进行比较。实验验证本文采用随机森林作为分类器的合理性,验证了本文设计的模型的有效性。
其他文献
足迹信息是犯罪现场的重要痕迹信息,在刑侦领域扮演着重要的角色。目前对于足迹图像的研究主要针对赤足足迹,然而在犯罪现场得到的足迹一般是鞋印足迹,鞋印足迹相较于赤足足迹存在纹理不同、赤足特征被掩盖等问题,因此如何通过鞋印足迹得到对应人物的赤足足迹,也是足迹领域需要解决的问题。针对上述情况,本文使用深度学习技术将光学鞋印图像反演成赤足图像,主要研究内容为以下四个部分:(1)构建光学足迹图像数据集。使用光
学位
人类文明在历史演进的过程中,死亡总是与其相伴相生,在不同文化形态的影响之下,死亡也逐渐演化出具有差异性的文化模式,不同文明在如何面对死亡方面也发展出了独特的丧葬文化。数千年以来,在中国民间,一套相对固定的殡葬模式慢慢形成,但受封建思想和宗教影响,传统葬礼仪式存在铺张浪费和迷信活动等问题。新中国成立后,为了解决殡葬过程中的这些问题,政府开始倡导殡葬改革,逐步推行各种相关政策,以此来移风易俗,改变以往
学位
“十四五”时期是宿州市深入打好污染防治攻坚战、实现生态环境根本好转、建设美丽宿州的关键期。本文在总结宿州市“十三五”时期大气污染防治工作成效、存在主要问题及“十四五”面临形势分析的基础上,主要提出“十四五”时期宿州市治理对策,以达到明显改善宿州城市大气环境质量的目的。全文主要包六个章节,第一章节为绪论,包括宿州大气污染防治源头治理的选题背景以及对于宿州市的重要意义。第二章节分为大气污染治理一些基本
学位
随着科技的进步和生活水平的不断提高,人们对于自身的生命健康更加关注。在日常生活中,个人是否患有高血压疾病是不易察觉的,但是其带来的危害数不胜数。因此,如何高效的检测血压,提前预防高血压的危害是人们不断研究的问题。人工检测血压需要专业的操作人员和专业的操作手法进行检测,而且不能每时每刻检测出血压值。近年深度学习技术的发展,使得基于卷积神经网络进行无创血压预测这种高效的检测血压方法成为可能,然而此方法
学位
在深度神经网络学习的大背景下,语音识别技术(Automatic Speech Recognition,ASR)作为人工智能、模式识别等领域中重要的一门技术,得到了迅猛发展。随着智能设备的普及,语音识别技术被广泛的应用在日常生活和工作中。然而当人们在复杂的现实场景中使用语音识别技术时,例如特定的行业领域、噪音环境等场景,语音识别面临更大的挑战。因此,越来越多的专家和学者关注复杂环境下的语音识别技术的
学位
<正>陈鹤琴先生的“活教育”思想,非常重视从大自然、大社会帮助幼儿获得知识,提高认知能力。自然生态理念强调幼儿的多种感官体验,契合幼儿探索自然、亲近自然、感知自然的心理诉求,也为美术教育开辟了广阔的前景。为此,幼儿园应以亲自然的方式构筑美术教育学习环境,唤醒幼儿对美术创作的美好期待,
期刊
学位
随着能源危机的严峻挑战和使用化石燃料造成的环境恶化,人们开始寻求绿色、可持续发展的新能源。氢气(H2)作为一种高能量密度、可持续的能源燃料,具有无污染、无碳排放和可再生的特点,吸引了研究人员的关注和青睐,其中裂解水制氢得到了学界的重点关注。此外,对太阳能的转换和利用也是一大热点课题,而半导体材料一直以来,是能量转换的核心。金属有机框架由于具有半导体特性,以及比表面积大的特点,既能作为电催化裂解水材
学位
八大山人《芝兰清供图》虽不属于八大画作中为人耳熟能详的“名画”,但是这件作品充满着烟火气息和清新的格调,是后人认识八大山人其人其画的又一个窗口,它是我们从绘画史中获得的宝贵遗产。国内外八大山人研究者多是选择八大艺术成熟期的代表作对其进行作品个案研究,而本文着意研究的《芝兰清供图》是八大山人弃僧还俗、走还南昌五年后,刚走出“个山驴”时期的作品。此时他颠疾康复,恢复了与诗僧画友的交游活动,渐渐融入日常
学位
伴随着我国经济社会的高速发展和城市化进程的快速推进,城市绿化需求旺盛。加之我国先后启动了“国家园林城市”、“国家森林城市”评定程序,推动了园林绿化行业快速发展,各地园林绿化企业和工程如雨后春笋般涌现。然而,在城市园林建设对绿化质量要求越来越高的同时,科学合理的质量评价体系和评价方法却没有适时地建立起来。园林绿化工程数量与日俱增而缺乏精品工程,大部分绿化工程的质量达不到理想的绿化效果。目前,国内有关
学位