基于亲密度及影响力的微博社交兴趣圈挖掘算法研究

被引量 : 0次 | 上传用户:NET399
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络是近几年来迅速崛起的一类新型Web服务,它们以用户之间的在线朋友关系为基础,使得人们可以在朋友间自由的分享兴趣和活动。Twitter和新浪微博是第二代社交网络,即微博服务的代表。随着移动互联网的发展,微博已经成为了最为流行的信息传播平台,拥有巨大的影响力和海量用户社交数据。社会网络的分析和挖掘目前已经成为了研究的热门领域,社区发现作为社会网络分析中的重要方面,也获得了极大的关注。现有的社区发现方法大多面向全局网络,以某节点为中心的局部网络社区发现算法比较缺乏;现有方法主要考虑网络的连接结构,忽略了亲密度、影响力和用户交互行为等社交因素;现有方法大部分是单分类算法,能够发掘重叠社区的多分类算法尚不完善。论文基于以上问题,提出了基于用户亲密度及影响力的微博社交兴趣圈挖掘算法。所提算法基于微博用户个人交互数据,采用了逐步扩充的策略,同时考虑到了网络连接结构、用户亲密度和影响力三方面因素,主要工作如下:1、在中心用户的一级交互图中,利用图论中k团社区的理论,寻找能够形成用户多个社交兴趣圈的种子集合。此工作主要考虑网络连接结构,生成高质量的社交兴趣圈核心,同时初步确定用户社交兴趣圈数量。2、形式化定义了用户之间的亲密度及用户与现有社交兴趣圈之间的归一化距离,之后设计了贪心算法,基于用户的亲密度对所发现的社交兴趣圈种子进行扩充。3、基于用户的交互行为对PageRank算法进行了扩展,用来计算微博用户影响力,进而在中心用户的二级交互图范围内,基于影响力对社交兴趣圈再次扩充,得到最终挖掘结果。此外,论文设计了社交兴趣圈自动标注算法,利用微博用户的兴趣标签作为数据,通过挖掘每个圈中成员的共性,并结合前文计算的用户影响力和TF-IDF的思想,为发现的每个社交兴趣圈自动标注标签。论文还开发了微博社交挖掘与分析试验平台,可以直观的显示出算法的执行效果并且收集用户的反馈数据,用以进行算法的对比实验。实验结果验证了所提算法的正确性和有效性。
其他文献
旋转轴是机械设备的核心部件,通过检测、分析旋转轴振动信息能够及时地获取设备的运行状况,因此旋转轴振动信号检测对设备状态诊断具有重要意义。为满足市场对小型化、低成本
跨文本指代是指在多个文档中多个指代词指向同一个实体,它主要面临的问题多名现象和重名现象。跨文本指代消解的任务就是要解决多名现象和重名现象,即进行多名聚合和重名消歧
近年来,互联网的发展可谓一日千里,由其引发的企业信息化的改革也是如火如荼,改革的快慢大大影响着企业在竞争激烈的市场中的发展。建立企业邮箱是企业信息化的一个重要组成
随着电子技术、计算机技术的迅猛发展和半导体工艺的逐步成熟,LED(发光二极管Light-EmittingDiode)凭借体积小、功率低、使用寿命长、高亮度、低热量、环保、坚固耐用等诸多
网络购物已经成为人们生活中不缺少的购物方式。它具有方便、快捷等特点,使用户能够足不出户浏览和购买想要的商品。人们通过网络会话的方式向客服咨询商品信息。客服通常会同
近年来,随着互联网的迅速发展,越来越多的人选择在线消费他们所需的服务,来代替传统的消费模式。这样的新型模式,不仅提供给消费者更多的选择空间,而且能帮助他们节省消费时
实际应用中,相对于数据的大量、快速产生,对应的标记信息获取却十分困难,如Web评论数据,在线交易等,使得已有的数据挖掘算法面临着巨大的挑战。为此,迁移学习的研究受到了广
网格已经成为网络的一种技术和基础设施,其目的要实现不同组织间的协同工作和有效的资源共享,但由于在网格计算中存在不同的用户并且要计算不同的应用程序,用户对任务的调度
多核处理器需要片上通讯系统以应对核间并发通讯,并提供良好的可扩展性。片上网络凭借传输路径多样化的特征,成为了多核核间通讯的重要解决方案。但是目前上层软件所需的核间传