基于机器学习的钓鱼检测技术研究

来源 :东华理工大学 | 被引量 : 5次 | 上传用户:xuthusboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钓鱼网站通过包装为正常网站诱骗用户输入关键信息从而完成窃取,对网络及公众的安全构成了威胁。决策树是一种可以运用于识别钓鱼网站的高效算法,但其中的ID3算法对连续值无法处理,而Cart决策树则会规避这一缺点,并且在实际应用中误判为正常网站的危害远大于误判为钓鱼网站。因此本文选择具有较高检测效率的Cart决策树算法并通过引入代价函数,调整特征的权重从而减少钓鱼网页的漏报率,进行非平衡性的结果输出。在深度学习中,机器自主提取特征已成为主流,但特征的提取一直是启发式模型的瓶颈,而卷积神经网络可以对海量数据集进行抽象提取,并具有较好的拟合性,但其训练耗时较长,同时也会产生梯度消失等难以解释的黑箱效应。因此本文利用ReLU函数的稀疏特性,在卷积神经网络用链式求导计算权值时,作为它的激活函数来解决这一问题。结合以上两点,本文提出新的钓鱼检测模型CNN-DT,该模型主要采用了利用ReLu函数作为激活函数的卷积神经网络并优化其结构,来用于特征的提取;并且加入了引入代价函数的决策树作为特征分类器,对钓鱼网页进行检测。经实验验证,优化后的CNN-DT模型在检测精度和检测速度上都有了显著的提升,有更强的鲁棒性,证明该模型可较好的运用于钓鱼检测。
其他文献
利用2014年京津冀地区4次重度污染过程中的AQI数据及相关气象资料,分析了4次重度污染过程中相对湿度、平均气温、平均风速和海平面气压的一些特征。结果发现:京津冀中南部是重
目的探讨改良胆道圆管式冲刮匙在肝内胆管结石治疗中的临床应用价值.方法根据肝内胆管的解剖和肝内胆管结石的分布特点,将传统胆道刮匙改良为圆管式冲刮匙,把100例肝内胆管结
以泰州过江超大跨斜拉桥为例,就主塔分别采用高桩承台基础和沉井基础两种形式,对比研究桩基础大质量承台参与结构高阶水平向振型的质量参与系数分布、周期分布等特点,输入人工地
目的研究探讨脂肪肝患者血脂及肝功酶学指标变化。方法随机选取2018年1月至2019年1月于我院接受治疗的脂肪肝患者800例作为研究组,并选取同期正常志愿者800例作为对比组,通过
<正>工程建设企业就要以项目为中心,项目为王。面向价值、回归本源,就是面向客户的价值,回归我们为客户创造价值的本源。只有信息化指向客户价值的企业才是信息化企业,这才是
泛在学习理论认为,任何人在任何时间、任何地点都可以通过使用身边的学习设备获取所需要的任何信息,其理论基础有:以人为本的教育价值观、后现代主义学习观、社会建构主义和情境
本文简要介绍了OECD组织,并对OECD数据库的特点和内容做了详尽阐述.
随着中国特色社会主义进入新时代,社会组织在现代社会治理体系中发挥着越来越重要的作用,社会组织诚信建设也成为重要的时代课题。上海在社会组织诚信建设领域经过多年的探索
【正】 在吉林市区以东的第二松花江东岸,由南至北依次是炮台山、帽儿山、东团山、西山、龙潭山等低矮的山峦,绝对高度约250~380米,相对高度约50~100米,南北延绵约6公里。山地
大学生就业指导课程旨在培养在校大学生掌握就业相关的知识、能力、技能,但由于认识不足,课程建设起步时间晚,其教育教学的过程中也出现了诸多问题。将教育生态学的基本理论