论文部分内容阅读
信息技术的迅猛发展使得社交网络在人们工作和生活上的重要性愈来愈强,渗透着人们生活的方方面面,与社交网络有关的研究也愈发受到关注。社交网络信息传播研究是社交网络研究中比较受关注的领域之一。由于在线社交网络的迅猛发展,信息传播的研究也有各种各样的挑战,其规模之大,拓扑结构之复杂,再加上信息传播过程的动态可变性等等困难和难题都是我们在设计有效的策略和传播模型时需要考虑的。本论文在代价预算、时间以及社区等维度对在线社交网络的信息传播进行了研究工作:本课题为解决代价最小化信息传播问题,提出名为MOWC的启发式策略。此算法综合地考虑了社交网络的静态拓扑和代价预算等因素,该算法先计算出节点的权重与代价的比值,然后依次地选择比值较大的节点作为种子节点,直到预算耗尽为止。我们使用了Random、MaxDegree和SingleDiscount等算法,在不一样的数据集以及代价预算时进行了实验,实验结果表明我们提出的算法能取得更好的结果。实际的在线社交网络中,信息的传播过程中会存在时间的延迟,时间的延迟有很多因素引起的,比较常见的就是社交网络中的各个用户的上线时间的不同导致了时间的延迟。我们在研究信息传播的过程中考虑了用户的上线模式,设计了TCIO信息传播模型。我们首先对时间敏感的影响力最大化问题进行了说明,并证明了其为NP难问题,并且影响力函数满足单调性和子模型。然后针对该问题提出了SimpleGreedy算法,此算法的主要思想是,先根据我们设计的信息传播模型仿真模拟信息传播来计算节点的影响力,再用贪心选择的思想依次选取那些有较大的边际影响力增益的节点并作为种子节点,直到预算花完为止。为了进一步减少计算量并优化代价选择,我们提出了GMAI算法,该算法根据在线社交网络图的信息传播特性近似计算节点的边际影响力从而得到种子节点集合。本论文使用SimpleGreedy算法、GMAI算法与其他算法在数据集不一样时进行了对比验证,得到了预算、信息发布时间以及有效时间变化时,我们提出的算法依然能取得较好结果的结论。最后,可以通过这个实验看出在信息传播的过程中,时间起着很重要的作用。对于具有社区结构的社交网络,在考虑信息时延的同时,在不同的时间片具有不同的社区结构,由于社区结构的变化可能造成节点影响力的变化。一般启发式算法有可能导致影响力的重叠问题,并且通常没有考虑到时间对社区结构和影响力的影响,本课题基于时间敏感的社交网络的社区结构性质提出了TCDD算法。TCDD通过社区发现算法来划分社交网络中的初始社区图,并选择出重要的社区,根据社区的大小分配种子数目并采用度折扣算法形成候选种子集合。每个时间片的社交网络图根据上一个时间片微调形成的,我们可以得到各个时间片的候选种子节点并汇总作为总的候选种子节点,最后根据预算和代价选出最终的信息源集合。本课题在不同数据集时,使用TCDD算法和其他算法进行了相关实验并得到了相应的结果,当代价预算、信息发布时间以及有效时间不一样时,TCDD算法均能得到相对不错的效果。