基于线性SVM的钓鱼网站检测系统的设计与实现

来源 :北京建筑大学 | 被引量 : 1次 | 上传用户:nocloud
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息时代的快速发展,网络安全也越来越被重视。现如今的电子商务相关产品的层出不穷使得个人信息安全问题变得严峻。因此我们必须对此做出相应的对策。在这个信息时代,用更智能的方法将钓鱼网站检测变得更加方便简单。钓鱼网站一直是网络安全中需要解决的难题之一,它的隐蔽性很高,但造成的损失往往很大。针对钓鱼网站的研究,有很多学者通过机器学习算法对钓鱼网站和正常网站进行分类。本文主要根据在钓鱼网站检测中常用的分类算法为基础,通过对网站的URL特征和页面内容特征进行实验比较研究,同时设计并实现了一个高性能的钓鱼网站检测系统。主要工作内容如下:1)首先本文分析了一次完整的钓鱼网站攻击案例,之后结合现今的钓鱼网站检测技术,其中包括黑白名单库检测机制、启发式钓鱼网站检测机制和基于视觉相似性的检测机制。并针对上述检测机制进行了优劣比较和总结。2)然后通过调研及钓鱼网站的发展趋势,设计并实现了钓鱼网站检测引擎,其中包括黑白名单检测机制,分析了几种查询算法的原理,并优化选择最佳的算法,黑名单检测机制主要工作是直接过滤大量已经鉴别过的网站,降低系统性能开销;引擎的第二部分是URL检测机制,通过收集现今钓鱼网站的URL,并分析这些URL的特征得到了11个钓鱼网站的URL特征,通过逻辑回归算法对其进行训练并分类;最后一部分是页面内容特征检测,结合钓鱼网站实际情况,通过每篇前K个特征选取方法,结合线性SVM算法得到高性能模型,并且通过实验对比得到最佳的页面内容特征数。3)最后介绍了钓鱼网站检测系统的整体架构设计和系统部署方式以及系统的运行性能,在架构设计中考虑了系统最为服务系统的性能问题,并设计实现了高性能的服务系统架构;在系统部署中提出了Nginx反向代理服务器作为,并分析其原理,为整个系统做负载均衡;系统性能测试先对各个检测进行训练,对比常见分类算法对于页面检测系统中的性能,然后对系统进行整体测试得到最后的检测结果。
其他文献
随着中国汽车产量的迅猛增加,相对应的汽车涂料市场也飞速发展。为适应新一市场的需要,对应用户不同的质量、价格需求,各汽车涂料供应厂家也采用不同的新技术、新工艺、新材料来
土库曼斯坦阿姆河盆地卡洛夫-牛津阶碳酸盐岩地层有丰富的天然气资源,相比盆地的西北部,东南部储层特征的认识程度不高。本文利用目的层段的系统岩芯资料,开展了岩芯观察、铸
分析了单系列四分仓回转式空气预热器在基建安装调试期间产生异音的原因。通过检查轴承和接触面、加固支撑结构,消除了影响机组运行的重大隐患,对新建电厂同类型空气预热器的
为研究充填膏体的蠕变特性,对以水泥、粉煤灰、煤矸石制备的充填膏体试件进行分级加载蠕变试验,试验结果表明,充填膏体具有较大的瞬时弹性变形,变形值随应力水平的提高而增加
科技智能赋能基础设施,不仅能让反复开挖彻底成为历史,更能更新城市管理思维,提升城市管理水平。以智慧道路为智慧城市建设的重要切口,更“聪明”的深圳将触手可及。$$深圳首条智
报纸
习近平总书记在哲学社会科学工作座谈会上的重要讲话,为繁荣发展我国哲学社会科学事业提供了思想指南和实践动力,开启了中国哲学社会科学大推进、大发展、大繁荣的春天,是当前和
报纸
高校"阳光体育"心理效益评价指标的科学选取,直接影响到评价体系的有效性。论文依据整体性、间接性以及独立性等阐述了评价指标的选取方法,用问卷调查和项目分析法筛选评价指标
大型锻件的热处理包括第一热处理和第二热处理,第一热处理又称锻后处理(冷却),一般在锻造(水压机)车间终锻后随即进行;第二热处理又称最终热处理,一般是粗加后在独立的热处理车间进行
介绍了大中型燃煤发电机组回转式空气预热器基本工作原理,并从工作原理和运行环境两个方面分析了导致漏风量大的原因和目前常规的降低漏风的措施。结合某1050MW超超临界燃煤
当前,我国正处于从制造大国向制造强国发展的过渡时期,制造行业在人口红利消失的背景下,人力资源成本不断上升,企业人均效能急需提升。成立于1996年的音品电子(深圳)有限公司(以下简称“音品公司”),迫于经营成本压力而随意压缩企业的人力资源管理成本,导致产生员工生产效率低下、人力资源管控与企业战略目标脱节等一系列问题。为此,公司通过重新构建人力资源成本的系统管控解决企业目前的人力资源管理问题,促使企业