基于专家知识库的反钓鱼系统的设计与实现

被引量 : 2次 | 上传用户:xjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络钓鱼是指钓鱼攻击者将人们日常生活中使用频繁普遍的网络作为载体,通过网络这个载体利用垃圾邮件、即时通讯、社交网络、手机短信群发等,设计出与被攻击网站非常相似的钓鱼网站作为鱼饵,在用户没有觉察时欺骗引诱出用户敏感信息,例如个人账户信息、密码、或信用卡详细信息,被攻击的用户受到不同程度的信息泄露甚至严重的经济损失。网络钓鱼近年来在全世界范围内变得越来越猖狂,严重影响到人们正常的工作和日常生活。为此,本文在分析了当前已有的反钓鱼技术基础上,提出了一种基于专家知识库的反钓鱼系统。本文在利用专家知识库本身特点的同时,改进专家知识库存在的缺点,结合钓鱼网站的特点设计了一种基于专家知识库的钓鱼识别系统。该系统从钓鱼网站URL结构特点和页面结构特点出发,设计出由黑白名单知识库、URL特征库以及页面特征库为主要部分的反钓鱼系统,通过严谨的数据筛选、详细的实现过程以及大量的数据评估,本系统得到了比较良好的效果。本文的主要创新工作归纳如下:1、提出了一种基于专家知识库的反钓鱼识别系统。由于传统知识库识别单一、效率低等缺点,本文在利用传统知识库匹配简单、快速、更新时效等优点的基础上,进一步改进了传统知识库匹的局限性,设计出能够实时更新的URL特征库和页面特征库。2、该系统从URL特征方面分析钓鱼网站的特点,将钓鱼网站的URL特征和匹配规则存储于特征知识库中。如果有新的URL特征出现,可直接更新到知识库中;如果要更新匹配规则,可直接更改知识库中已经存储的匹配算法,增强了URL特征库先验数据和检测算法在存储方便和更新及时方面的能力。3、该系统从页面特征方面分析钓鱼网站的特点,结合页面DOM特征在钓鱼网站页面中的体现,提出了八种钓鱼网站的页面特征,应用支持向量机SVM算法实施对特征页面的分类,同时将也页面特征和特征检测算法存储于知识库,使得页面特征和检测算法的方便存储和更新有了进一步改善。4、本文提出的反钓鱼识别系统除了设计专家知识库外,还结合了网站ALEAX排名、ICP备案和域名注册信息对网站的识别做补充判断,在最后的环节减少了误判、错判现象的发生。以往的反钓鱼识别技术要么只针对钓鱼网站的URL特征,要么只针对钓鱼网站的页面特征,在特征更新方面考虑也比较欠缺。与以往的反钓鱼识别系统相比,本文设计的反钓鱼识别系统从URL方面和页面特征方面综合考虑钓鱼总体相似特性,并且在专家知识库的基础上,对特征的存储、匹配规则以及更新都有了比较大的改进,在前人的研究基础上本文设计的系统能实现较好的性能。
其他文献
随着不同类型网络之间数据的共享和融合,当前广播数字电视网的传统业务形式已不能满足用户、网络运营商双方的业务要求。近年广电网运营商已经开始不断追求提供更为人性化、
基于钻井和实测资料对研究区进行有机地化和沉积学分析,总结典型富生烃凹陷黄河口凹陷3套湖相烃源岩的特征及沉积背景,以此为基础进行层序研究,探讨黄河口凹陷古近系湖相烃源
从图书馆建筑对大学校园特殊意义的阐释入手,解析清华人文社科图书馆设计理念产生的由来和历程。在此基础上,结合重要公共界面的营造,归纳了博塔在设计母题选择和场地文脉融
信息社会,个人数字信息高速膨胀。作为新兴的存储方式,云存储具有低成本、可扩展、无实体等优点,因而受到越来越多用户的青睐。用户在使用云存储的过程中需要关注两方面的安
发展养鹅业是振兴我省农村经济的重要途径赵霞,安宇平,汪连涛(黑龙江省畜牧研究所)谢永坚(黑龙江省畜牧局)一、发展养鹅业是振兴农村经济的需要我国商品经济的发展,使一些开发性农业
讨论了漆膜耐冲击性测定时的影响因素,单位表示以及仪器和测试方法的进展。
《拟邺中集诗》在语句、风格、开篇方式等方面多有模仿、借鉴曹植作品之处,显示谢灵运对曹作之熟悉与倾心。组诗据相关史料、作家作品等真实性资料虚构了一场君臣尽欢的宴会,
本文采用气相色谱-质谱联用法测定墨水中的苯酚。通过反复进样及多次实验,建立了气相色谱-质谱联用法测定墨水中的苯酚。线性回归方程为:y=63911x-37458,R2=0.9998。方法的检出限
本文主要描述以HT48R30A单片机为微处理器构成的电路系统硬件的工作原理,着重介绍了本系统所应用的各硬件接口技术和各个接口模块的功能及工作过程.通过载体显示数据,所以具有人
随着互联网和物联网技术的高速发展,一个“信息爆炸”的时代已然来临。首先,在企业内部,部门之间存在各种分散的生产报表、财务报表、销售报表、.人力资源报表等各种类型的异