论文部分内容阅读
数据量的爆炸性增长以及数据生产范围的急剧扩大,对数据挖掘分析任务提出了更高的要求。随着网络的发展,当前的信息网络是由成千上万的实体通过相互连接而形成的,反映了实体之间的相互作用。目前,信息网络已经成为人们生活中不可或缺的一部分。而网络作为一个强有力的工具,能够清晰显示复杂系统内实体间的依赖关系,还能从宏观整体层面反映系统的运行情况,可以利用这些信息维护系统的安全,指导系统未来的发展等。本文的研究选择了三个领域的复杂系统,并将其抽象为网络,利用网络拓扑信息对系统中的实体进行行为检测,分别是通信网络中的异常流量检测问题,社交网络中的链路预测问题以及航空运输网络中的准点率分析问题。结合复杂网络,针对不同领域的不同问题设计了新算法,并通过具体实验验证了算法的有效性。本论文的具体工作如下:(1)设计了一种融合图特征和内容特征的异常流量检测方法。由于攻击者难以获得整个通信网络的全局特征,因此本文提出的算法提高了其伪装的难度。该算法不仅考虑了单条流量的内容特征,还通过图表示学习方法生成了图特征,设计不同的融合方式进行实验,实验结果说明该算法有效提高了异常流量检测的准确率。(2)提出了一种基于优先链接的链路预测方法。针对时序加权网络的链路预测问题,首先提出了时间衰减效应,并对节点相似性指标进行了时序加权扩展,然后将目标节点对周围的边按照端点类型的不同进行分类,改进了优先链接算法。仿真结果表明,该算法在链路预测问题中能够获得更高的预测准确性。(3)基于航空运输网络的拓扑结构及节点属性,设计了分析影响航班准点率因素的方案。对航班网络和航路网络进行了深入分析,讨论了不同因素影响航班准点率的具体原因。这些有益结论将为提高航班准点率的实际应用提供一定的参考。