论文部分内容阅读
随着互联网的普及,在线社交和互动日益成为人们重要的交流方式之一。其实时性和便捷性彻底改变了人们的传统交流方式,极大地丰富了社交关系。但与此同时,在线社交和互动形态也给虚假恶意信息提供了广泛传播和扩散的机会。因此,如何追溯虚假恶意信息的传播路径和传播源,以期辅助公安部门的舆情监管工作,成为一个关键问题。为研究上述问题,本文旨在分析在线社交网络(OSN)的传播特性和结构特性,并据此提出网络结构溯源算法和信息传播溯源算法。所谓OSN,即参与在线社交的社会个体及其之间的多重连接关系构成的社会性拓扑结构,是研究人员对互联网中个体间的在线社交关系的抽象描述。目前,国内外对于OSN溯源问题的相关研究工作集中在使用流行病传播模型和信息传播模型仿真信息传播路径,从而推断传播源。这类研究对于探索复杂网络中各种不同的信息传播行为有所帮助,但无法解决当今大规模在线社交网络溯源问题面临的诸多挑战。例如,OSN的信息传播过程难以精准描述,虚假恶意信息溯源被网络结构的复杂性和动态变化屏蔽和误导。基于以上挑战,本文首先对OSN的统计特性和网络特性进行分析,然后分析OSN的信息传播特点,最后提出基于OSN的信息溯源算法,包括网络结构溯源和信息传播溯源。基于OSN的网络结构溯源使用一种基于克罗内克网络模型的初始邻接矩阵生成算法,基于OSN的信息传播溯源使用一种优化的INFOPATH算法。实验部分使用多数据集和多评测指标,以期全面评估算法有效性。在基于OSN的网络结构溯源实验中,使用六组真实网络数据和六项评测指标验证网络结构溯源的准确性。在基于OSN的信息传播溯源实验中,利用模拟网络数据和真实网络数据分别评测算法的可泛化能力和准确性。实验结果表明,基于OSN的网络结构溯源算法推断的低维初始网络在扩展后与真实OSN具有较高拟合度;相比于INFOPATH算法,基于OSN的信息传播溯源算法提升约4%的F值。