微博社会网络中人物与团体信息挖掘

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:JK0803fengwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的到来,社会化媒体以前所未有的方式改变了人们的生活方式,尤其是微博的出现,它彻底颠覆了人们获取信息的方式,让人们不仅仅是信息的获取者,同时也可以即时发布信息和传播信息。微博作为社会化媒体典型的代表,它允许用户根据自己的兴趣个性化定制自己的关注列表,每一个微博用户既可以是关注者也可以是被关注者,正是这种关注与被关注的关系使得微博用户之间形成了一张巨大的社会网络,从而使微博也兼具社交属性,人们获取信息,传播信息也正是依托于这张社会网络。本文主要是面向微博社会网络的研究,主要从用户之间的关系,网络中呈现的团体特性等方面进行研究,通过关系计算,团体挖掘来发现微博社会网络中潜在的社会化现象。通过对微博社会网络的研究,本文相信会对社会化搜索、信息推荐、社会化电子商务、微博营销、精准广告投放等方向的研究起到推动促进作用。因此本文主要完成了以下三方面的研究工作:第一,本文主要是以新浪微博为数据源,由于新浪微博是一个开放平台,利用其开放平台的特性,通过调用其开放API接口获取微博数据,并对获取的数据进行解析和分析,然后以xml文件格式进行数据表示和存储。第二,对微博用户之间的社交信息和交互信息进行模型化表示,通过计算微博用户之间的社交信息的相似性,并以交互信息作为标准答案证明了社交信息相似性计算的有效性,其中粉丝信息相似性最能反映用户之间的亲密性。并采用社交信息相似性的计算方法,进行了用户推荐实验,并取得了不错的推荐效果,其中通过粉丝信息相似性的推荐效果最好。第三,在社交信息相似性的基础之上,通过设定相似性阈值,可以生成一个相似性网络,在此相似性网络上采用经典的基于图切割的CNM(Clauset、Newman、Moore)团体挖掘算法进行了团体挖掘实验,然后采用我们开发的社会网络分析可视化系统进行了结果可视化。实验以NLP领域微博用户为例,形成了NLP教师团体、NLP企业团体、NLP学生团体等几个团体。
其他文献
随着Internet的迅猛发展,信息呈现了爆炸式的增长,这种现象必然会造成信息过载,使得人们更迫切的希望从海量信息中找到自己感兴趣的内容。信息检索在一定程度上解决了人们检
随着云计算技术的发展和成熟,应用云计算技术的企业与个人数量显著增加。随着云计算的发展,新的问题与需求,即云集成问题,也随之而来。云集成需求期望使处于不同云环境中的云服务
近年来,三维网格动画被广泛应用于在线三维游戏、远程医疗系统等不同领域。为了表现强烈的真实感,三维网格动画的细节信息不断丰富,从而导致数据量呈指数倍扩大。因此设计有效的
在机器学习的许多实际问题中数据有多个视图,各个视图间有着互补信息和相关信息,可以通过对这些信息的挖掘来提高学习的性能。然而由于先验知识的缺乏,如何在多视图学习利用多个
车辆自组织网络(Vehicular Ad Hoc Networks,VANETs)因其在智能交通方面的广阔应用前景,受到了研究人员的普遍关注,近年来不断获得重要研究成果。路径质量是车辆自组织网络重
近年来,立体成像和显示技术得到了高速的发展,市场上已经出现多种立体显示设备,观察者可以通过众多途径体验到立体效果。然而,立体成像所需的立体片源由于拍摄校准难、后期处
WebEx Meeting是思科子公司WebEx的核心产品,为客户举行网络研讨会还是在您组织中的任何地方需要网络会议用于内部业务流程,通过举行您自己的网络会议与客户、供应商、合作伙伴
随着移动通信业务多样化的不断发展,个人信用问题越来越受到移动运营商的关注。目前大多省市的移动运营商很少有客户的信誉记录,只要用户欠费,系统就会停止向客户提供服务。
随着计算机和网络技术的广泛应用,工作流已成为协调企业业务流程、提高它们应变能力和竞争力的一项重要技术。然而,工作流管理系统中有许多安全隐患,深入研究工作流管理系统
图像马赛克生成技术,通常是指将一幅输入图像分割成一系列规则或者不规则区域,再从图像数据库中选取适当的图像对其分割区域进行覆盖,目标是希望通过上述操作后生成的马赛克结果