基于LDA的社交网络链接预测模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:cy2cc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的不断发展,基于社区的服务,如Wikipedia、Flickr和Facebook等越来越流行。在社区中,人们可以寻找和上传自己喜爱的图片,可以与社区中的其他用户进行链接,成为朋友。社交网络是依靠人与人之间的朋友关系组织在一起的系统,是现实人际网络的子集。社交网络用户数量的急剧增加,给网络中用户关系、用户信息等数据的挖掘带来了巨大挑战。利用用户节点的属性信息、社交网络的拓扑结构特征等预测用户节点对之间是否存在朋友关系链接,便是其中一个研究热点。现有的社交网络链接预测算法,如CN算法、AA算法、katz算法等,主要关注社交网络中用户节点对之间的拓扑结构相似特征,缺乏对其属性信息之间潜在语义关系的重视,链接预测的精度不高。此外,在社交网络中,用户的兴趣信息数量巨大,如果直接对每个用户的每个兴趣进行语义关系分析,则需耗费大量时间。针对以上问题,本文引入主题模型、潜在迪里克雷分布模型(LDA, Latent Dirichlet Allocation),首先利用LDA模型对用户节点对之间的兴趣信息进行建模,提取社交网络用户兴趣信息的主题,比较主题之间的语义相似度,这与直接对每个用户的兴趣信息进行分析相比,能够在捕获信息的潜在语义关系的同时,有效降低计算时间复杂度。其次,把复杂网络中的网络资源分配算法RA (Resource Allocation)用来对社交网络的结构信息进行特征提取。然后,通过构造分类器,利用有监督学习框架综合语义特征和拓扑结构特征进行社交网络链接预测。通过在真实的社交网络Livejournal数据集上进行实验,与现有的链接预测算法比较,结果证明,本文提出的基于LDA的社交网络链接预测模型与已有的工作相比,在一定程度上,能够有效地提高链接预测精度。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
自投产以来锅炉捞渣机频繁发生各种事故,如链条脱轨、掉大焦压死、渣箱变形严重、出力不足等等,问题较多,运行不够稳定,经常不能满足机组300MW负荷需要。主要原因是捞渣机渣
目的对比分析彩色多普勒超声和多层螺旋CT检查急性胰腺炎的临床价值。方法88例急性胰腺炎患者作为研究对象,所有患者均行彩色多普勒超声、多层螺旋CT检查,比较两种检查方法的
药品作为维护和保障人民生命和健康的有力屏障,其安全与否,能否实施有效监管,关系到广大消费者的用药安全,关系到公众生命健康权益的维护和保障,影响着社会的稳定和政府的公
哈木线THDS设备大多分布在铁路沿线,哈木线海拔高,气候恶劣,冬季降雪后易堵塞设备探头孔影响探测。通过吹雪装置的研制,可以保证THDS设备正常工作,经过现场实际运用检验,效果
通过工程实例分析了盾构在富水砂层和裂隙水丰富的岩层中掘进时易发生螺旋机出土口喷涌现象的原因,并介绍了一些控制喷涌和减少碴土掉落的措施,以供类似工程参考。
为了有效地解决投资项目违约风险问题,建立了风险型投资项目的违约赔偿半连续式收益评估模型.该模型不仅考虑了投资方预计项目收益,而且还考虑了对方违约时对其所造成的损失
目的考察老年人健康心理控制源与体育运动量之间的关系。方法选取广州市社区≥65岁老年人331名,采用日常生活能力量表(ADL)、多维度健康状况心理控制源量表(MHLC)、自评健康
<正>从病因角度来讲,慢性咳嗽分为特异性咳嗽和非特异性咳嗽,前者指咳嗽是某些诊断明确的疾病症状之一,如百日咳、肺结核、哮喘等;后者指咳嗽为主要或惟一表现、X线胸片未见
目的:分析医院住院患者抗菌药物的应用现状及趋势,为临床合理用药提供依据。方法:对医院2015—2018年住院患者抗菌药物的使用率、用药频度(DDDs)、使用强度(AUD)等进行统计分