论文部分内容阅读
社会网络节点行为的异常检测是社会网络演化分析的重要部分,不仅对社会网络形成机制、演化分析、行为预测等方面有着重要的理论价值,并且在网络安全,国家安全,金融风控等领域有广泛的应用。但是,目前大部分研究都是从节点拓扑结构角度分析节点异常,缺少对节点行为演化的建模与异常分析。而且,大都采用单一异常检测方法进行节点异常检测,而单一异常检测方法在不同异常类型的检测中效果可能不一样,稳定性和适应性较差。针对上述社会网络节点行为异常检测中存在的问题,论文主要做了下列工作:(1)论文阐述了静态网络和动态网络中节点的异常行为内涵,并提出了社会网络节点异常行为检测分析框架。针对静态网络中的异常点的探测,论文提出一种结合网络嵌入和聚类方法的社区发现与异常节点检测框架(COFNC),该框架采用网络嵌入方法将静态网络中的节点转换成为高维空间中的数据点,同时采用基于密度顺序树划分的聚类算法实现对社区结构和异常节点的同时发现。(2)针对动态网络,论文采用隐变量模型对节点行为演化进行建模,将节点行为的演化转换成为多维时间序列,因此,节点行为的异常检测问题转换成了多维时间序列中的异常检测问题。同时,论文提出基于异常排序的异常检测方法(READ方法)实现对节点异常行为的检测,并提出一种节点行为可视化的策略。(3)因为随着网络的演化,我们可以获得一些人工标注的节点异常或正常行为,先根据已标注的信息构建节点行为的先验知识库。基于先验知识库,论文采用随机模型计算节点行为的异常偏好值,提出基于异常偏好的异常检测方法(SEADP方法)提升对节点行为异常检测的效果,其基本思想是以节点行为的异常偏好为目标,采用垂直排序的方法选择需要集成的异常检测方法,并采用平均值方法集成已选择的异常检测方法。(4)采用向量自回归模型预测社会网络节点行为,针对社会网络节点行为数据中存在的异常可能影响模型预测的精度,论文采用随机森林算法重构异常行为数据,再采用向量自回归模型对重构后的数据进行拟合和蒙特卡洛仿真的方法对节点行为预测。论文通过Enron网络数据和仿真数据测试了异常检测算法的效果,发现采用异常检测集成方法READ比采用单一异常检测方法的效果更好,而且能够有效的实现对不同类型的异常检测。同时,相比于READ,综合了先验知识的异常检测集成方法SEADP能够实现选择性的集成异常检测方法,并且显著提高异常检测的准确率。另外,实验发现对节点行为演化数据中的异常行为进行重构之后再采用向量自回归模型能够提高对节点行为预测的准确率。