基于社交关系的用户兴趣演化模型研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:tprgaefe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网技术的飞速发展,社交网络平台日益流行,新浪微博作为我国目前最流行的社交网络平台之一,其信息的时效性与爆发式的传播速度,吸引了大批我国的网民,包含巨大的商业价值。传统广告推荐模式的效果低下且易被人厌烦,随着基于用户兴趣的广告精准投放模式愈发被重视,新浪微博中巨大的用户数量与用户兴趣也愈发具有研究价值,而如何精确的描述与预测用户的兴趣,有着重要的研究意义。当前多数的研究是单一的从用户微博信息或用户的社交关系来进行,并不能很好的描述用户兴趣,而微博信息的时效性也随时可能为用户带来新的兴趣,基于此,本文提出了基于社交关系加权的WSALSA(Weighted Stochastic Approach for Link-Structure Analysis)算法和艾宾浩斯遗忘曲线的兴趣预测模型,为此做了以下方面的工作研究:对微博语料文本的处理,由于微博属于短文本结构,文本集过于稀疏,无法直接将微博文本集作为训练文本进行LDA(Latent Dirichlet Allocation)主题提取。针对上述情况,首先对微博文本进行去噪处理,去掉其中无意义的微博文本及网页链接等;其次对内容中交互的对象的信息进行提取与存储。之后,为了解决文本稀疏导致的主题分布不明显的问题,采用训练外部语料库的方式对原有的微博文本集进行扩充,对比了直接训练微博文本集与中文维基百科语料库的主题-词概率模型后发现,维基百科语料库训练结果中,主题中的词语更能直观的表现该主题所属领域。基于社交关系的用户兴趣模型研究,在采用LDA主题模型对用户微博文本提取主题的基础上,考虑微博用户关系中影响力大的用户的兴趣对该用户兴趣的影响,通过社交关系强度加权的方式将影响力大的用户的主题作为该用户兴趣的扩充。在对用户间关系强度的分析过程中,按关注关系和交互关系对用户间的社交关系进行强关系和弱关系的划分,并给出关系强度的定义以及算法实现。在对用户影响力分析过程中,本文通过对微博社交网络的研究分析,提出一种基于社交关系加权WSALSA算法网络结构中用户节点的影响力进行排序,并通过实验及结果评估表明本文提出的加权WSASLA算法具有较好的影响力排序结果。以划分时间窗口的方式来描述用户兴趣随时间的变化情况,考虑到用户受其他用户兴趣的影响,提出了基于社交关系强度加权的社交关系-主题映射模型,通过对用户已关注的影响力较大的用户在相同时间窗口的主题进行分析,将该窗口下的主题以关系强度加权的形式对用户原有的兴趣主题进行扩充。通过实验及评估,该方法获得的用户主题能更全面的表现用户兴趣。当前对用户兴趣演化模型研究中,主要通过用户兴趣强度变化及内容的变化来分析,因此,本文借用艾宾浩斯遗忘曲线规律及重复学习的过程,以多阶段遗忘曲线的形式映射到连续的用户窗口中,通过分析用户主题在时间片上的概率变化来分析用户兴趣的变化情况。
其他文献
北部湾吹沙型填海场地日益成为带动北部湾地区经济发展的重要战略基地,而有些场地具有厚层的海相软土及砂土,土层形成时间短促,固结状态处于初始且持续的变动阶段,场地卓越周期也因此而持续变化。本文以典型吹填场地的软土层、吹填砂土层为主要研究对象,通过开展室内振动台模型试验以及采用FLAC3D软件进行数值模拟,探究北部湾软土吹填场地在不同场地条件变化下的地震动响应以及卓越周期演化规律。本文主要研究工作和成果
学位
DMF(N-N二甲基甲酰胺)和大多数化工原料能够以任意比例互溶,是化工生产过程中的重要溶剂。近年来,随着人们环保意识的提高,越来越多的企业开始对DMF废液进行回收处理,这不仅
图像超分辨率重建是一种通过算法把低分辨率图像放大到高分辨率图像的技术。该技术不仅可以提高图像的视觉效果、满足人们对高清画质的需求,而且有利于后期的图像处理任务。
农地流转作为土地制度改革的核心,具有降低耕地细碎化、改善经营规模、促进非农就业、保障国家粮食安全、改善农户家庭化流动等诸多潜在收益,是传统农业向现代农业转变的必经
第一部分 超声引导下聚桂醇硬化治疗子宫肌瘤的安全性评价目的:研究超声引导下聚桂醇硬化治疗不同类型、不同位置、不同大小子宫肌瘤的安全性。方法:2014年1月至2017年6月,在
随着人工智能的热潮席卷全球,机器人的发展受到广泛关注。室内移动机器人作为机器人研究领域的重要分支,吸引了诸多学者的注目,其中地图构建与路径规划是室内移动机器人导航研究的热点和难点。目前,已知环境下的机器人导航技术已相对成熟,但未知环境下的机器人导航还有些关键问题亟待进一步研究。本文首先研究了机器人在室内环境下的定位问题,采用基于信标的UWB定位技术为机器人提供较为准确的位姿估计;然后研究环境地图未
学位
频谱感知技术是认知无线电技术(Cognitive Radio,CR)的关键,用于探测授权频谱中的可用信道。主用户(Primary User,PU)活动状态的高效检测对于有限的频谱资源利用具有重要意义。协作频谱感知(Cooperative Spectrum Sensing,CSS)可以有效地解决单节点感知不可靠的问题,但另一方面也会增加网络能耗。与此同时,当次级用户(Secondary User,S
近年来,智能机器人配备RGB-D相机作为其视觉感知系统已经成为一种新的趋势。物体识别作为其视觉系统的重要功能之一,长期以来一直是研究人员关注的难点。其主要原因在于实际环境(如桌面、货架物体堆放等)中的众多不确定性:其中单一视角下,由于堆放造成的物体间相互遮挡、表面信息丢失等问题直接影响了识别和位姿计算的正确率和精确度。针对这一局限性,前人利用机器人的可移动能力提出了主动物体识别的概念,即通过增加视