社会网络影响力建模与度量

来源 :清华大学 | 被引量 : 0次 | 上传用户:zhongxuhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会影响力是个人由于社会地位、社会联系以及社会财富等因素,改变他人思想或行为的能力。研究社会影响力,特别是在大规模社会网络数据上对人与人之间的影响力进行建模与度量,对于社交应用中的商品推广、好友推荐、专家发现以及用户行为预测等都具有非常重要的意义,对于虚拟商业市场以及国家舆情监控等都具有重要的促进作用。已有大量关于社会影响力检测、建模、度量以及应用等方面的研究工作,但在此方面仍然存在许多未解决的问题与挑战。本文主要从社会影响力的建模与度量方面做深入研究。主要研究内容包括:首先,社会影响力与网络结构特性密切相关。对社会影响力的结构特性进行分析有助于更加深入的理解信息传播的机制,以及更加准确的度量影响力大小。然而已有研究一般忽略了用户之间的网络结构特性所引起的影响力差异。本文针对群体影响力,提出结构多样性的分析与度量指标,进一步更精准地给出结构影响力的形式化定义;针对个体的被影响力,提出收益函数的形式化定义,进一步在真实数据上扩展出概率图模型来学习个体的被影响力与网络结构特性的关系。其次,社会网络结构的动态演化特性加大了影响力建模与度量的难度。已有研究一般假设网络结构是静态的,而忽略了网络结构动态性与传播动态性的交互发展对影响力建模与度量的影响。本文提出用户建立关系的行为之间的影响力传播模型,用以刻画社会网络的动态演化过程。进一步引入关系之间的三角形结构来解决数据稀疏的问题,并学习三角形结构对应的影响力参数。最后将该模型与度量结果运用到好友推荐最大化的应用中,利用影响传播效应加强推荐的效果。最后,随着网络结构数据与用户行为数据的爆炸式增长,传统的影响力度量方法的效率受到极大的限制。本文提出大规模社会网络中个体之间影响力的采样度量算法。理论证明了采样次数的下界。在一个10亿条边规模的微博网络数据上,验证在不损失效果的前提下,近似方法比最优的比对方法大约提速300倍。进一步提出大规模社会网络与用户行为流数据上关于结构影响力的采样度量算法。理论证明了采样方法的无偏估计性。在一个200万节点,3亿条边,以及2千万条用户行为记录的微博转发数据集上,验证在不超过1%的错误率下,近似方法比精确方法约提速10倍。
其他文献
给出了一种小型飞行器定位误差修正方法。由飞行器运动方程 ,推导出了斜距和飞行状态之间的关系。根据所测得的飞行状态 ,利用 Kalman滤波方法可得斜距估计。根据实测值、最
针对一起电气线路短路引发的出租屋火灾事故的调查,探讨了火灾现场勘验、调查询问、技术鉴定等环节对认定火灾原因的重要性,并阐述了做好火灾善后工作及出租屋消防管理工作的
论文基于云存储概念,首先具体分析了云存储系统构架模式、典型拓扑结构、技术优势及特点,并与传统的存储架构模式进行了对比,然后提出了一种基于云计算的新的存储策略。新的
随着异构数据的快速增长,异构数据间的检索出现效率瓶颈。本文提出引入哈希这种简单的表征形式来加速异构数据间的检索。然而,传统哈希方法无法对异构数据的异构性建模,因此,
蛋白酶活化受体-1(PAR-1)是PARs家族中第一个被发现的成员,也称凝血酶受体。PAR-1被肿瘤微环境中的蛋白酶水解激活后,介导多种肿瘤细胞的生物学行为:促进肿瘤细胞增殖、黏附
模型教学能够使抽象的数学问题变得具体、形象、生动,有助于学生理解知识.基于此,探讨了模型教学在初中几何中的应用.
一个正在走向文明、民主、自由的社会必定需要许多因素的扶植和推动 ,法律作为当今社会最常运用的社会管理工具 ,自然也包括在这些因素之中。一国法律的价值取向将在很大程度
随着互联网的迅速发展,个性化推荐系统已经逐渐成为各种网络应用中不可缺少的核心功能,并以各种各样的方式影响着人们日常生活的方方面面:电子商务网站中的购物推荐引擎为用
提出了一种新的考虑避碰约束的编队卫星入网路径规划策略。首先通过常规编队卫星入网的多脉冲线性规划方法,得到一组卫星入网的脉冲序列,以此预测轨道机动过程中各星之间的最
<正>浙江省在全省开展电子文件和数字档案登记备份工作,我对它的了解分四个阶段:第一次听说大概在去年的5月份左右,听韩局长对这项工作作过简单介绍。当时韩局长说鞠局长刚到