【摘 要】
:
异常检测识别数据集中显著区别于其它正常模式的数据,广泛应用于欺诈检测、入侵检测、数据分析等领域。现实世界中数据间存在复杂的结构关系构成了复杂网络,在数学形式上表示为图。当前面向复杂网络异常检测的需求日益增加,特别是对网络安全至关重要,其中属性网络异常检测由于其越来越多地用于建模各种复杂系统而引起广泛关注。现有的绝大数方法都是单独考虑网络结构或属性信息来检测异常,忽略了网络中节点的结构和属性的融合信
论文部分内容阅读
异常检测识别数据集中显著区别于其它正常模式的数据,广泛应用于欺诈检测、入侵检测、数据分析等领域。现实世界中数据间存在复杂的结构关系构成了复杂网络,在数学形式上表示为图。当前面向复杂网络异常检测的需求日益增加,特别是对网络安全至关重要,其中属性网络异常检测由于其越来越多地用于建模各种复杂系统而引起广泛关注。现有的绝大数方法都是单独考虑网络结构或属性信息来检测异常,忽略了网络中节点的结构和属性的融合信息。此外现有的动态属性网络异常检测方法仅从单个时间戳网络的特征来检测异常,忽略节点的结构和属性信息将随时间而变化,导致检测性能不高。本文针对以上存在的问题完成了以下三个工作:(1)本文总结了当前复杂网络异常检测的方法与研究进展,首先提出复杂网络异常检测的必要性与发展历史,接着分别从静态图和动态图的视角将复杂网络异常检测分为基于结构、社区、关系学习的静态图异常检测和基于节点、边、子图、全图的动态图异常检测,然后分类别地进行概述、分析与比较,最后给出了复杂网络异常检测的应用场景。(2)针对现有静态属性网络异常检测中存在的忽视节点结构和属性模态间相互作用的问题,本文提出了基于游走的自编码器静态属性网络异常检测方法ARWAD。该方法的核心思想是首先通过游走节点结构图捕捉网络的结构信息,游走节点-属性二分图捕捉与属性关联的融合信息,然后通过输入到Skip Gram和CBOW组成的自编码器中获取节点的结构和融合信息的重构误差;再通过多层属性自编码器获得节点的全局属性重构误差;以上三种重构误差构成节点的异常得分,最后通过设定阈值和得分排名来检测异常节点。在四个真实的网络数据集中的实验显示了ARWAD检测方法的有效性。(3)针对现有的动态属性网络异常检测方法中的网络特征提取会因为节点的频繁出现和消失而出现性能下降,从而导致没有充分考虑网络的拓扑结构、节点属性和它们的时间演化特征来检测异常节点。本文提出了基于演化GCN的动态属性网络异常检测方法DAEGCN。该方法的核心思想首先利用三层图卷积网络为每个时间戳属性网络建模,以捕获网络的高阶结构和属性信息,然后通过GRU演化GCN卷积层的权重矩阵捕获时间戳t之前的网络信息,融合动态属性网络的结构、属性和时间演化特征学习时间戳t的网络特征表示,最后将特征表示输入到结构解码器和属性解码器中,获得节点的结构重构误差和属性重构误差,通过计算节点的异常得分排序获得节点的异常标签。在三个真实的动态属性网络数据集中的实验表明提出的DAEGCN模型明显优于其它的动态属性网络异常检测方法。
其他文献
随着攻击技术不断发展,防御信息存储与传输所面临的各种威胁成为当今安全芯片领域的研究热点。物理不可克隆函数(Physical Unclonable Function,PUF)利用器件制造过程中固有的工艺偏差产生具有随机性与唯一性的数字指纹。攻击者难以通过常规攻击方式破解、克隆其中加密数据,可极大提高芯片的安全性。随着物联网技术不断更新,器件集成度不断提高,设备对能耗要求越来越高,极大限制PUF电路的
面积和功耗限制了芯片性能的进一步提升,底层硬件的运算能力也不能满足日益增长的计算需求。与此同时诸多容错应用,如多媒体处理、数据挖掘和图像识别,也被越来越广泛的使用。在这样的背景下,人们提出了新的设计范式——近似计算。近似计算牺牲精度来换取电路性能的提升,可以为容错应用设计高效节能的系统。近似计算是指计算结果与正确结果之间存在偏差。近似计算技术应用到逻辑级优化电路的核心思想是人为引入一些错误输出来简
随着人工智能时代的来临,对于芯片算力和功耗的要求日益提高。目前单片的晶体管密度已经达到0.9亿/mm~2,例如,英特尔基于IVY Bridge的四核芯片大约有十二亿个晶体管。设计这样异常庞大且复杂的电路无法依靠人力实现,必须使用自动化方式。电子设计自动化(EDA)是进行芯片设计所必不可少的工具,而标准单元库是使用EDA工具进行芯片设计的核心。当下主流的集成电路采用FinFET器件,目前FinFET
随着“制造强国”战略的提出以及5G技术的广泛应用,与之相关的物联网技术得到了快速发展。然而,由于受到了电池寿命及更换电池困难等因素的影响,如何实现物联网各类传感节点的自供电已逐渐成为工业界和学术界广泛关注的热点话题。事实上,日常环境中存在丰富的射频能量信号源,大部分射频能量的发射具有全向性和全时段特性,会造成大量能量的浪费。因此,本文设计了一种基于射频能量收集的低功耗传感节点,可为传感节点的自供电
SLAM(Simultaneous Localization And Mapping),即同步定位与地图构建,是机器人在一个完全未知的环境中解决定位、地图构建和导航的关键技术。SLAM系统通常由视觉里程计、闭环检测、后端非线性优化和地图构建等环节组成,其中闭环检测部分通过判断图像之间的相似性来解决位姿估计随时间的漂移问题,在SLAM系统中起到了重要的作用。传统的闭环检测方法大多采用人工设计的图像特
深度学习技术已经在很多领域得到了广泛应用。与此同时,深度学习的安全性问题也随之而来,尤其是对抗样本问题。研究表明,目前大多数的深度学习模型容易遭受对抗样本的攻击。攻击者可以通过向正常样本添加细微的扰动,来生成高伪装性的对抗样本。深度学习技术的使用使语音识别技术更加高效与准确,帮助语音识别系统更好的理解用户,使语音识别技术真正走向了实用化。但对抗样本攻击的安全性问题,在目前主流的语音识别系统中仍然存
随着当前信息时代的发展,神经网络以及机器视觉被开发的功能越来越多,并且在许多领域已经可以代替人类进行高精度以及高强度的工作。同时,随着社会经济的不断发展,越来越多的人选择长时间的坐姿办公模式,虽然长时间的坐姿办公显得轻松自在,但一系列日益严重的坐姿引起的疾患问题也随之而来,比如肌肉骨骼疾患、近视等。头部以及肩部姿态可以很大程度上反映人体坐姿状态。例如坐姿状态下的颈椎、用眼、手部、脊椎等情况。因此,
随着车辆工业和世界经济的快速发展,汽车的数量不断增加,各种交通事故也越来越多。据统计,约五分之一的事故是由驾驶员在驾驶车辆中存在接电话、与乘客说话等分心驾驶行为导致的。交通安全问题已经成为全球关注的焦点,如何快速、准确地检测出驾驶员的分心行为,避免分心驾驶引发的交通事故是研究人员面临的一大难题。近年来,卷积神经网络(Convolutional Neural Network,CNN)凭借其突出的特征
传统索引方式一般是一种通用的数据结构,不特别针对数据分布和特征设计或优化其索引方式,随着数据空间维度或数据量的增加,可能会导致存储消耗大且查询效率急剧下降。相较于传统的索引结构,学习型索引可通过学习数据的分布与特征来优化索引,进而可提升索引的查询效率和空间效率。由于多维数据一般无法直接给出确定顺序,当对查询数据有顺序要求时,则无法直接使用学习型模型学习数据的分布,因此学习型多维索引根据对查询数据是
一直以来,僵尸企业是我国经济发展中的巨大隐患。为此我国各地实施了一系列处置僵尸企业的决策,其中首要任务是对僵尸企业识别和分类。目前,已有的大量研究是在传统僵尸企业识别方法(如FN-CHK)上进行改进,但普遍存在如下问题:数据分析不全面,基于单一特征进行分析,识别过程中掺杂过多主观性。鉴于此,本文结合近年来热门的集成学习分类模型对企业数据进行自动和全面的挖掘分析,并设计僵尸企业识别方案,进而实现僵尸