一种基于网页关联性特征的钓鱼检测方法

被引量 : 0次 | 上传用户:grandbill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钓鱼网站是指不法分子利用各种手段仿冒的银行、电子商务等网站,以此来骗取用户银行或信用卡账号、密码等私人信息。为了取得用户的信任,钓鱼袭击者通常会模拟合法网页来构建钓鱼网页,所以一个钓鱼网站与它的目标网站之间是有着很强的关联性的。本文提出一种基于网页关联性的钓鱼网页检测方法。网页关联性主要包括网页图像感知哈希关联性、搜索关联性、文字关联性和网页整体关联性,本文将这四种关联性用于钓鱼网页的检测以及特征库的构建与更新,主要的工作与贡献如下:首先,研究基于图像感知哈希关联性的钓鱼网页检测方法。将网页以图片格式保存,提取图像的主要可视像素点,由这些像素点组成感知哈希序列,再进行图像的相似度匹配。该方法既克服了钓鱼网页存活时间短的问题,又能快速地与特征库进行匹配。实验结果表明,该方法在保证一定误判率和召回率的情况下大大提高了匹配速度。其次,研究特征库的构建。钓鱼网页更新速度是很快的,所以在进行反钓鱼袭击的工作中,除了要考虑钓鱼检测方法的优劣外,还需要考虑特征库的构建问题。本文提出一种新的由钓鱼网页查找目标网页的方法,用这些目标网页来构架特征库。该方法通过提取到的钓鱼网页中的关键词组成一个词汇签名,将词汇签名在多个搜索引擎上进行检索,综合搜索结果,最终找出钓鱼网页的目标网页。经过实验验证,该方法收集的数据确实提高了钓鱼检测方法的正确率。最后,研究特征库的更新。利用搜索引擎检索目标网页的方式来及时更新网页特征库。仿真实验证明,对特征库进行更新有助于降低误判率。
其他文献
以某BOT污水处理厂为例,根据该厂的工艺和设备特点,对其电耗组成进行了分析,在保证出水水质达标的前提下,通过部分项目改造、耗电设备运行优化以及加强用电管理等措施,实现了
近年来,随着我国高速公路和高速铁路建设的迅速发展,工程中遇到因膨胀土流变而引发的灾害问题时有报道,这些流变灾害也给工程建设造成了严重的损失。正是因为如此,有关非饱和
<正>随着互联网普及程度的提高以及电子政务、电子商务的不断发展,传统领域的违法犯罪活动逐渐向互联网渗透,网上违法犯罪案件逐年大幅上升,犯罪类型不断扩展,作案手段不断翻
<正> 上海音乐学院青年教师林凯最近完成了他的交响诗《伊犁草原随想曲》,1月28日由青年指挥家张国勇指挥上海电影乐团在上海音乐厅首演成功,受到广大听众的欢迎和
期刊
<正> 唐传五弦琵琶谱,现藏于日本京都市右京区阳明文库。这是1939年被日本政府指定为国宝的一个宽九寸三分,长三丈余的写卷,共记有二十八首乐曲。当它于本世纪三十年代被发现
安宁温泉镇地热田属断裂深循环对流型地热系统。天然出露7个温泉泉点,均出露于螳螂川谷底一级基座阶地前缘含水层组中,在温泉大桥下螳螂川两岸均有溢出,以“天下第一汤”为中
目的研究p14ARF、mdm2、p53在鼻咽癌组织中的表达与临床分期、淋巴结转移、预后等因素的关系。方法应用免疫化法检测58例鼻咽癌组织和20例慢性鼻咽炎症组织中p14ARF、mdm2、p
在进出口通关中,企业和海关经常会因为商品归类产生分歧,从而影响了通关效率,造成企业的经济损失。文章着重从企业的角度,就归类的技术性、归类体系的把握能力和归类规则的了
试验观察了几种中药复方提取物的抗仔猪腹泻作用,并对抗腹泻机理进行了深入探讨。结果表明:白头翁、苦参、黄芪、三颗针、黄柏、党参等复方提取物能够显著降低仔猪腹泻发生率
大数据技术在网络安全领域的价值日益凸显。文章从保护校园网络信息安全的角度出发,在网络流量分析领域进行了深入研究和实践,从采集存储海量网络流量元数据到使用大数据平台