【摘 要】
:
随着Web时代的不断发展,互联网用户面临的网络安全环境越来越严峻,现在网络账号呈现爆炸式增长,研究账号的风险状态是一个具有现实意义的问题。在本课题中识别两种不同类型的风险账号:针对用户来说是被盗取的账号;针对应用服务来说是一些攻击应用、传播非法信息的恶意账号。针对目前存在的账号风险识别误报率高、未知异常行为识别效果差等问题,本文进行了账号风险识别模型的研究。首先,进行账号风险识别需要收集数据,本文
论文部分内容阅读
随着Web时代的不断发展,互联网用户面临的网络安全环境越来越严峻,现在网络账号呈现爆炸式增长,研究账号的风险状态是一个具有现实意义的问题。在本课题中识别两种不同类型的风险账号:针对用户来说是被盗取的账号;针对应用服务来说是一些攻击应用、传播非法信息的恶意账号。针对目前存在的账号风险识别误报率高、未知异常行为识别效果差等问题,本文进行了账号风险识别模型的研究。首先,进行账号风险识别需要收集数据,本文中采集的数据包括两部分,用户行为数据和应用日志信息,用户行为数据有鼠标行为、键盘行为、账号累计在线时间、页面访问顺序等,应用日志信息包含IP地址、域名、页面标题、请求协议、浏览器相关信息等。数据采集的方式是采用JS脚本的形式,内嵌脚本使得数据采集与应用服务相互分离。将采集的数据存入HDFS文件系统中,通过Map Reduce进行数据统计。其次,针对现有被盗账号风险识别误报率高的问题,提出了基于机器学习聚类分类算法的账号风险识别方法,聚类时引入粒子群算法改进了Kmeans算法,形成了PSOKmeans聚类算法,该算法避免了原始Kmeans算法对初值敏感的缺点,与其他改进Kmeans聚类算法相比,本文中提出的算法聚类效果更好。由于异常账号数量相对较少,直接分类的方式对数据量较少的类别效果不佳,所以采用先聚类再分类的方式进行被盗账号风险识别。聚类后采用朴素贝叶斯、决策树、随机森林三种分类算法进行分类识别账号风险。实验结果显示随机森林算法的准确率最高,达到了90%。最后,针对现有恶意账号状态变化过程无法预测的问题,提出了基于改进隐马尔可夫模型的账号风险识别方法,在获取隐马尔可夫模型参数时,采用模拟退火算法改进参数的学习过程,改进后的参数学习算法可以获得更优的模型参数。由账号的观测变量来分析账号的隐含状态变量,从而判断账号一段时间内的状态变化,实验结果显示隐马尔可夫模型可以有效的预测恶意账号的状态变化,恶意账号风险识别准确率能达到80%。本文的研究对于用户账号风险识别具有重要的参考价值和推动作用。
其他文献
随着城市化深入发展,通过城市更新,挖掘已有建设用地潜力,盘活城市存量土地,提升旧城区功能已成为城市可持续发展的必然选择。但在对旧城区进行大规模更新改造过程中,城市原有的功能空间结构被打破,城市内部功能空间格局发生深刻变化,城市功能空间布局呈现出多样化与复杂化特征。因此,开展旧城区更新改造及其影响下的城市功能空间耦合分异特征研究,将为新型城镇化背景下旧城区功能重塑以及更新政策的制定提供科学依据。本文
生产上对顶端优势的利用广泛,常利用去顶或者控制侧枝生长来调控植物的形态建成,构造理想株型促进产量。硼在作物生长发育过程中有不可或缺的作用,缺硼影响植株地上部和根系
冷弯薄壁型钢因为轻质、高强等优势被大量应用于工业厂房,民用建筑中。冷弯薄壁型钢的常见连接方式有普通螺栓连接、自攻螺钉连接等。高强螺栓在受到外荷载作用前被施加了很
青西凹陷是位于酒泉盆地的富油凹陷,致密油勘探前景良好,以下沟组的泥云岩为主要储层。由于储层微观特征不清等因素制约着致密油的开发,因此对储层的微观结构的研究就十分重
云计算自诞生以来就由于其高可用性、可伸缩性和成本效益得到高速发展和广泛的应用。云计算的迅猛发展使得规模庞大的数据中心需要巨额的电源供给来维持运作。随着云服务提供商的规模扩大,基础设施的耗电量很可能成为限制数据中心发展的最大瓶颈。无论是从提高云服务提供商的经济效益的角度,还是从保护环境减少致使全球变暖的二氧化碳排放的角度来说,提高数据中心的能源使用率都是绕不开的话题。而基于云计算的受欢迎程度,学术界
在过去的几十年里,由于人类活动向水域环境中输送过量的营养物质,一些河口沿海水域同时出现酸化和缺氧现象。在自然生态环境当中,白天夜晚动植物的呼吸与光合作用,使得海水中
随着高速铁路的迅猛发展,高速铁路的电能采集装置——弓网系统所面临的问题也愈发严峻。接触电阻是影响弓网系统受流质量的重要指标之一,其影响因素也是十分复杂。本论文旨在
气候变化背景下,干旱灾害频发。农业生产受干旱的直接影响,每年干旱都会造成严重的农业经济损失。淮河流域冬小麦生长期间降水量普遍不能满足其生长需求,对冬小麦产量具有重要的不利影响。鉴于现有的降水数据记录,评估气象干旱相对容易。因此,调查冬小麦干旱对气象干旱的滞后时间,为冬小麦干旱的监测和预警提供了一种可供选择的方法。本研究以淮河流域蚌埠闸以上地区为研究区,基于研究区60个气象站点的日尺度气象数据,运用
数据平面作为SDN(软件定义网络)结构中的基础设施层,包含了各类网络设备且通常与外网直接相连,因此容易出现各类安全事件。此外,SDN的其他抽象层级也会被数据平面中的安全事件所影响。为保障网络安全、稳定、持久的运行,面向SDN数据平面中安全事件的检测技术研究,具有重要的意义。首先,本文围绕数据平面的特点,对其中的三类安全事件分别进行了分析,并给出了一个SDN测试环境及其建设方法。分析了数据平面相关的
当代城市发展过程中,随着城市商业区空间高度复合及立体化发展的不断深入,为承载高效的城市运行和满足不断增长的经济发展需求,城市商业区街道呈现出愈发多样化的空间模式。