融合网页噪声和n-gram的钓鱼网站检测研究

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:myhululu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络钓鱼(phishing)是一种基于社会工程学,通过虚假诈骗的手段获取用户机密信息以换取经济利益的在线恶意攻击。面对日新月异的海量网络钓鱼攻击,提出一种新型、高效、高精确的网络钓鱼防御方式迫在眉睫,对网络钓鱼攻击防御的研究具有较高的应用价值。本文对网络钓鱼国内外研究现状做了简略概述,对研究网络钓鱼攻击的目的和意义进行了简介。论述了网络钓鱼攻击的概念和基本攻击流程,总结了目前网络钓鱼攻击防御技术的主要特点。作者主要工作和取得的研究成果如下。(1)针对PayPal和eBay钓鱼网站库进行研究,对库中钓鱼网站样本预处理后进行网页噪声提取,随后结合n-gram技术形成网页特征并进行与原网站的相似度比较,利用所得相似度进行网络钓鱼攻击检测。综上,提出了融合网页噪声和n-gram的钓鱼网站检测算法。该算法选用网页中含量较少且稳定的网页噪声对网页进行特征描述,较其他算法,具有计算成本更低,计算速度更快,检测时效性更高的特点。(2)分析利用钓鱼网站检测算法对钓鱼网站库进行检测的结果,并分别为PayPal和eBay设定了钓鱼网站检测阈值。随后,进行钓鱼网站检测算法的检测结果的精确度和召回率的计算,发现本检测算法较高的精确度以及可靠性,其精确度PayPal和eBay分别达到了0.8863和0.8964,而召回率分别达到了0.8550和0.8229。通过作案人员利用同一钓鱼网站模板,固定针对某些受保护网站而进行的、具有团队化的恶意作案。(3)通过采集PhishTank认证并公布的PayPal的2490个钓鱼网站和eBay的1699个钓鱼网站,采用“网页噪声和n-gram融合的分析算法”对网页进行特征描述,得到钓鱼网站网页特征矩阵。对这些特征矩阵进行聚类分析后所得的结果表明:在PayPal钓鱼网站之间,有83.33%的网站具有相近的相似度,eBay钓鱼网站之间,有81.63%的网站数具有相近的相似度。由此断定,当前网络钓鱼是出自高度相似或相同的网页模板,针对同一个某受保护网站反复进行的恶意行为,其具有作案团队化。
其他文献
对等网络(P2P)技术突破了传统服务器/客户机模式,已经越来越受人们青睐。互联网上基于P2P技术的应用也越来越多,涉及即时通信、数据共享、海量存储、协同计算等多个领域。然
随着Internet的普及和多媒体技术的发展,多媒体信息的安全及版权问题引起了越来越多人的关注,数字水印技术应运而生。鉴于小波技术发展的日趋成熟以及小波变换具有与人类视觉
光栅投影是目前使用最为广泛的一种三维形貌测量技术,在工业检测、质量控制、逆向设计、医学、虚拟现实、文物数字化和人体测量等众多领域具有广泛的应用前景。因为其原理简
网络自身安全机制的脆弱性、现有网络安全产品的局限性、以及各种网络恶意活动的日益猖獗导致了网络安全形势不容乐观。网络安全态势感知系统(Network Security Situational
粗糙集理论是一种处理含糊和不确定性信息的新型数学工具,其理论提出以来得到迅速的发展和广泛的应用。知识约简是粗糙集理论重要研究内容之一,它的主要目的在于去除数据中的
嵌入式系统地广泛应用使得嵌入式系统互连网络成为一种必然。但是由于嵌入式网络的异构性、异质性和对等性等特点,嵌入式的互连不能直接使用传统的网络协议。因此构建一种能
在临床医学领域中,超声彩色血流成像(CFI)因其经济适用、无侵入、无损伤、对人体影响小并且能够准确得到待测剖面的二维血流速度分布,是诊断心血管疾病的重要技术。随着国家
近年来伴随着对约束数据库理论和应用技术的大量研究,数据库上的约束问题逐渐成为新的关注点和热点。随着关系数据库使用的不断深入,在关系数据模型中除几种基本的完整性约束
随着Internet和电子商务的发展,现代企业业务越来越复杂,业务重组及跨平台等问题给工作流管理系统的发展带来更大的机遇和挑战。目前工作流管理系统大都基于静态过程定义,而
随着人类基因组测序的完成,对蛋白质结构和功能的研究成为基因组学研究的一大热点。研究证明,蛋白质在其功能组中很少以单个个体而存在,一般与功能相似的蛋白质之间存在相互