基于社交网络的生成模型及推荐系统研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cbbbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统能够挖掘出用户可能感兴趣的内容,一定程度上缓解信息过载问题。在推荐系统中利用社交网络信息不仅符合真实场景中用户对于物品的选择过程,同时能够缓解推荐系统中普遍存在的稀疏性和冷启动问题。因此基于社交网络的推荐算法引发了学术界与工业界的关注。现有的基于社交网络的推荐算法还存在一些问题:一,推荐算法核心在于计算用户之间的影响力,大多数算法利用相似度公式进行计算并作为影响力使用,不同的相似度计算方式对于推荐效果影响巨大;二,多数推荐算法没有模拟真实世界中用户对于物品的选择过程,忽视了用户兴趣偏好与用户社交网络的建立是互相影响的动态过程。针对上述问题,本文提出了基于社交网络的两个推荐模型,分别是基于社交网络的生成推荐模型(social based generative model for recommendation)(简称SoGeM)与基于社交网络的矩阵分解推荐模型(social based matrix factorization model for recommendation)(简称 SoMF),并设计实验证明这两个模型的推荐效果优于其他6个经典的baseline算法。本文研究的主要成果包括:(1)提出基于隐含狄利克雷分布(latent dirichlet allocation)(简称LDA)并结合社交网络信息的SoGeM推荐模型,SoGeM假设用户对物品的交互行为来自于用户自身偏好或社交好友影响,将选购行为模拟为一个生成过程,通过使用吉布斯采样法对模型进行训练,能够实现对用户选购模式的建模,并量化获取好友间影响力大小,从而能够计算任意用户选购任意物品的概率大小并将概率最大的top-n物品推荐给用户。(2)本文分析说明了 LDA与矩阵分解(matrix factorization)(简称MF)的内在联系,将SoGeM的模型假设映射到MF中并提出SoMF模型。通过使用随机梯度下降法对SoMF模型进行训练,同样能够实现对用户选购模式建模并量化好友间影响力大小,从而进行物品推荐。(3)选取4个社交平台上的数据集对所提模型的有效性进行实验验证,使用准确率(precision)、召回率(recall)及平均倒数排序(mean reciprocal rankk)(简称MRR)进行效果评估,实验表明SoGeM与SoMF模型的推荐效果优于其他推荐算法。基于SoMF及SoGeM模型,设计并实现了基于社交网络的原型系统。本文首先对基于社交网络信息推荐系统的研究意义进行分析,指出现有研究存在的问题,在此基础上提出SoGeM与SoMF模型,之后进行实验验证与原型系统设计,最后是工作总结与未来展望。
其他文献
传统封闭的网络体系被软件定义网络的分层思想解耦为数据平面、控制平面和应用平面,网络的集中控制与管理在逻辑上得到了实现。集中管控的机制和开放的编程接口增加了SDN管理
作为物联网的关键组成部分之一,机器与机器(Machine to Machine,M2M)通信能够借助无处不在的移动通信网络,无需在人的参与和干扰下实现各种数据测量和采集,完成全自动化的信
目的:检测VEGF-C蛋白在鼻咽癌肿瘤组织中的表达及VEGF-C对人淋巴管内皮细胞生物学行为的影响,分析VEGF-C表达与鼻咽癌临床病理特征的关系,探讨鼻咽癌淋巴转移的机制,为鼻咽癌
间断连接无线网络(Intermittently Connected Wireless Network,ICWN)是一种无需固定网络基础设施且能轻松部署的自组织网络,因此,其多应用于紧急通信建网及军事领域。节点间
青少年是新时代中国特色社会主义事业的建设者和接班人,他们的思想道德建设水平将直接影响到未来中华民族的发展。随着城镇化进程的加快,城中村作为城镇化进程中的产物,发生着翻天覆地的变化。城中村青少年作为青少年群体中的一部分,有着其独特的思想状态和特点。随着物质生活条件逐步提高,他们的视野逐渐开阔,这些状况给城中村青少年的现代教育带来益处的同时,也给城中村的思想道德教育带来了不同程度的负面影响。在这种背景
天发船收高频雷达是一种天波-地波混合体制的新型雷达,该雷达兼具天波雷达、地波雷达和舰载雷达的优点,具有超视距探测、隐身目标探测、超低空探测的优势,因此研究天发船收高频雷达具有重要的战略意义。目标状态估计是天发船收高频雷达数据处理的重要组成部分,在数据处理的过程中起着重要的作用,状态估计算法的性能决定着滤波精度和航迹跟踪效果。本课题针对天发船收高频雷达的工作特点研究该雷达体制下的目标状态估计方法。通
不平衡数据集主要是可以分为类间的不平衡和类内不平衡。类间不平衡指的是不同类别之间的样本数目差别较大;类内不平衡是指在某一个类别的内部,不同部分的数据分布成不同的簇(Cluster),不同的簇之间样本数目差距较大的情况。因为大多数的传统的机器学习方法默认使用的数据样本相互之间是平等的,并且假设其数据量是相对平衡的,所以数据集不平衡问题的最根本难点是样本的不平衡性往往会显著地影响大多数机器学习方法的性
近几年随着人工智能技术的高速发展,人脸表情识别在智能安防、测谎、智慧医疗、互联网教育等领域出现了广泛的应用场景。由于人们通过面部表达情感的方式不同,很难通过人工设计和选择特征的方法高效的获取人脸面部表情的特征分布,因此目前基于深度卷积神经网络自动提取面部表情特征的方法在人脸表情识别中发挥出越来越大的优势。人脸表情识别任务在计算机视觉领域一直是一个充满挑战的问题,由于人们个体情绪表达的差异性和不受控
边界元法作为一种数值方法,因其计算量小、精度高而得到了发展。边界元法能够自动满足无穷远处边界条件,不用进行人工截断,无需施加人工边界,处理无限域问题具备先天优势。有
物体位姿估计在计算机视觉、增强现实及机器人等领域具有非常重要的地位。现有位姿估计算法依赖于物体先验信息,如形状、大小,以及物体的运动轨迹。当没有先验信息时,采用相