基于链接分析和用户兴趣的微博社区发现算法

来源 :兰州交通大学 | 被引量 : 3次 | 上传用户:mahuanchun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种新兴的社交媒体,近几年发展迅速,影响越来越广泛,逐渐成为一种重要的交流平台。微博网络的大量用户组成了不同的虚拟社区,有效挖掘具有网络结构内聚性和用户兴趣内聚性的微博社区,对于提高微博个性化推荐、微博市场营销以及链接预测的准确性具有重要意义。目前,经典的社区划分算法大多缺乏对节点之间的链接关系以及节点内容的综合考虑,其划分出的社区普遍具有较低的兴趣内聚性。现有的基于节点之间的链接关系和节点内容的社区划分算法主要是通过分析用户所发的微博内容获得用户的兴趣信息。而用户发布的微博内容通常包含大量的噪音信息并且微博的发布具有很大的随意性,这使得微博内容难于准确反映用户的兴趣。基于以上背景,本文分析了用户资料,分析发现用户资料信息可以很好的反应用户的特点,本文将这些信息统一称为用户的兴趣信息。论文针对微博社区发现问题展开研究,在对已有的社区发现算法进行分析总结的基础上,根据微博网络的特点,提出一种基于用户之间的链接关系和用户兴趣的微博社区发现算法,使得划分的社区能够更好的反映真实的社会关系,达到网络结构内聚性和兴趣内聚性。论文的主要研究内容如下:首先,论文介绍了复杂网络中常用的经典社区发现算法,对比分析算法在微博社区发现中存在的优势及不足;对已有的社区评价方法进行了分类和介绍,并对网络分析工具作了简单的描述。其次,介绍了两个比较著名的微博平台,并对微博网络的特点进行了简单的描述;分析了微博网络中常用的两种社区发现算法存在的不足,然后引出了基于用户兴趣的社区发现技术。最后,论文分析了微博用户的链接关系和用户兴趣,推导出链接相似度公式和用户兴趣相似度公式,结合两者计算出用户之间的总相似度。根据用户之间的总相似度将微博网络转换成一个无向有权网络,在Louvain算法的基础上本文提出一种新的社区划分算法对微博网络进行社区划分。使用社会网络分析工具Pajek对社区进行可视化,得到社区的可视化效果,对社区有了更加直观的认识,通过引入不同的社区评价指标与已有的社区发现算法进行对比,验证了本文方法的有效性。
其他文献
由于网格环境的开放性,使得它不论是进行并行计算,还是进行信息的共享与互操作,都会面临各种各样的安全问题。同时,网格的跨管理域、异构和网格资源的广域分布性、动态性、异
对称密码算法专用描述语言(Special Description Language for the Symmetric Cryptographic Algorithm, SDLSCA)主要应用于密码学这一特定领域,是为了方便密码学专家描述密
科学和工程应用领域中的很多问题都可以通过数学建模转化为函数优化问题(Function Optimization Problems, FOPs),因而对函数优化问题的研究具有十分重要的理论和实际意义。免
随着Internet的快速发展与普及,如何在开放、动态、难控的网络环境下实现各类资源的共享和集成已经成为计算机软件技术面临的重大挑战之一,流程建模技术也受到更为广泛的关注。
随着互联网的发展和智能终端的普及,短信、微博、微信等现代信息传播手段被广泛应用,它们都具有使用便捷、传播快速等优点。相对而言,短信对受众的年龄与知识水平、移动终端
进入21世纪以来,各类网站社会性网络化的倾向明显,越来越多的网站集购物、交友、聊天、论坛和博客于一体,为用户提供全方位的服务。作为个性化服务的一种方式,个性化推荐系统能够
随着网络通信技术的飞速发展,多播路由的通信方式受到普遍重视。但当前多播路由算法的研究大多针对无约束多播路由问题和时延受限多播路由问题,在应用中缺乏典型性和实效性。本
关联规则挖掘作为数据挖掘领域中最活跃的研究分支之一,其目的是发现数据集中潜在的、新颖的、并为人类所理解的数据项间的关系。概念格理论,又称形式概念分析,用于概念的发现、
卫星舱装填问题可简单描述为:将给定的仪器和设备等有效载荷合理地、紧凑地放置在卫星舱的承载板上,满足给定的性能约束前提下,使舱室尽可能小。求解该问题时,一般都是将仪器
人类基因组计划和许多物种基因组测试的完成标志着一个新的生物学研究时代─后基因组时代来临了,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重