论文部分内容阅读
近年来,社交网络快速发展,网络平台的信息分享,互动给人们的交流带来了巨大的便利,用户只要通过“关注”这一行为,就可以获取到所有自己感兴趣的用户所发布的信息。但是随着关注人数的增加,这种复杂的网络关系给用户带来巨大的信息量,导致有用的信息被淹没,人们无法从海量的信息中找出自己的需求信息,产生严重的信息过载现象。 传统的解决信息过载的方法是个性化推荐,根据每个用户的兴趣推荐相应的新用户,但是,当关注用户量增长到一定数量时,有些用户不再会添加新的用户。此时,基于原本网络的结构优化也因此成为解决信息过载的有效方式。本文提出针对每个用户自身行为的特点,找到与其微博行为变化密切相关的用户群,去除现有结构中不必要的关注关系,既考虑了用户的兴趣,又避免了网络结构更加复杂,是一种解决用户信息过载既高效又实用的手段。 本文获取了新浪微博2013年2589名用户的微博数据信息。采用信息理论的方法,将用户的微博数据转化到概率空间,以转移熵评价关键性用户,使用互信息衡量用户获得的信息量,在信息量损失较小的条件下,剔除一定范围内的冗余用户,优化了社交网络结构。本文主要工作与贡献如下:(1)对微博数据集中用户信息进行处理,分析数据集,分析发现:与用户有互动行为的用户主要集中在一小部分用户当中,其余很大一部分的被关注者,用户并没有特别的关注行为产生;(2)符号转移熵能很好的体现两个用户之间的因果关系,判断信息流动的方向;(3)引入基于转移熵判定信息流向的理论,将其应用于互相关注的用户之间,实验表明,一个用户与其关注用户之间转移熵值有很大的不同,转移熵的大小可以衡量两个用户间行为的耦合程度;(4)提出一种结合转移熵和互信息的网络结构优化办法,实验表明,使用该算法可以使用户在获得信息量损失较小的条件下,去除用户关注网络中的冗余用户,简化社交网络结构。