论文部分内容阅读
网络钓鱼(phishing)是一种基于社会工程学,通过虚假诈骗的手段获取用户机密信息以换取经济利益的在线恶意攻击。面对日新月异的海量网络钓鱼攻击,提出一种新型、高效、高精确的网络钓鱼防御方式迫在眉睫,对网络钓鱼攻击防御的研究具有较高的应用价值。本文对网络钓鱼国内外研究现状做了简略概述,对研究网络钓鱼攻击的目的和意义进行了简介。论述了网络钓鱼攻击的概念和基本攻击流程,总结了目前网络钓鱼攻击防御技术的主要特点。作者主要工作和取得的研究成果如下。(1)针对PayPal和eBay钓鱼网站库进行研究,对库中钓鱼网站样本预处理后进行网页噪声提取,随后结合n-gram技术形成网页特征并进行与原网站的相似度比较,利用所得相似度进行网络钓鱼攻击检测。综上,提出了融合网页噪声和n-gram的钓鱼网站检测算法。该算法选用网页中含量较少且稳定的网页噪声对网页进行特征描述,较其他算法,具有计算成本更低,计算速度更快,检测时效性更高的特点。(2)分析利用钓鱼网站检测算法对钓鱼网站库进行检测的结果,并分别为PayPal和eBay设定了钓鱼网站检测阈值。随后,进行钓鱼网站检测算法的检测结果的精确度和召回率的计算,发现本检测算法较高的精确度以及可靠性,其精确度PayPal和eBay分别达到了0.8863和0.8964,而召回率分别达到了0.8550和0.8229。通过作案人员利用同一钓鱼网站模板,固定针对某些受保护网站而进行的、具有团队化的恶意作案。(3)通过采集PhishTank认证并公布的PayPal的2490个钓鱼网站和eBay的1699个钓鱼网站,采用“网页噪声和n-gram融合的分析算法”对网页进行特征描述,得到钓鱼网站网页特征矩阵。对这些特征矩阵进行聚类分析后所得的结果表明:在PayPal钓鱼网站之间,有83.33%的网站具有相近的相似度,eBay钓鱼网站之间,有81.63%的网站数具有相近的相似度。由此断定,当前网络钓鱼是出自高度相似或相同的网页模板,针对同一个某受保护网站反复进行的恶意行为,其具有作案团队化。