面向微博内容的个性化推荐算法的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:xujinchang5280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的普及和广泛应用,导致微博等社交网络信息爆炸,凸显了信息过载问题—一面对海量的数据,用户很难从中找到感兴趣的信息。而推荐系统是解决该问题的一个重要工具,受到了学术界和工业界的广泛关注。但现有微博推荐算法还存在着交互行为时效性考虑不足、数据稀疏条件下推荐准确率低以及群组硬划分等问题。针对上述问题,本文在研究分析现有微博推荐算法的基础上,提出基于联合概率矩阵分解的微博推荐算法和基于拓扑势的微博推荐算法。本文主要的研究内容包括以下三个方面:(1)提出基于联合概率矩阵分解的微博推荐算法。针对交互行为时效性考虑不足的问题,本文在用户之间点赞、转发和评论等交互行为基础上,通过引入遗忘函数,提出一种能区分不同时间段交互行为的影响力评估模型;针对数据稀疏条件下推荐准确率低的问题,引入联合概率矩阵分解方法对用户相似度矩阵和影响力矩阵进行联合概率矩阵分解,缓解了数据稀疏条件下推荐准确率不高的问题。(2)提出基于拓扑势的微博推荐算法。针对群组硬划分的问题,本文使用LDA主题模型分析微博文本的主题,并结合用户自定义标签构建用户兴趣偏好向量,使用KL距离计算用户偏好向量之间的相似度距离,引入拓扑势,根据用户间偏好相似度距离对用户进行聚类,划分出用户群组,实现用户重叠群组划分。(3)设计并实现了微博推荐系统。本文将基于联合概率矩阵分解的微博推荐算法和基于拓扑势的微博推荐算法应用于微博推荐系统,系统包含数据源模块、预处理模块以及微博推荐模块。数据源模块主要功能是爬取微博数据,预处理模块主要是对爬取的数据进行清洗、分类,微博推荐模块实现了两种推荐算法,向用户推荐符合其兴趣的内容。
其他文献
出版于1930年的《王云五大辞典》是我国第一部综合性的现代白话词典,主要反映了二十世纪初期的汉语词汇面貌。本文以此为语料来源展开汉语词汇的隐退研究,通过定量和定性分析
国内电力行业经历从2003年至2014年,历经10余年的高速发展之后,装机容量跟随大环境开始进入下行通道,国内电力市场日趋饱和,全国大部分省份相继出现发电站产能过剩的情况。国家加大宏观调控力度,新建设项目的审批不断收紧,装备制造企业产能过剩的情况近年来日益严峻。党的十九大上,习近平总书记提出供给侧改革,其中主要内容就是涉及到去产能和大力推动传统制造企业向制造服务型或服务型企业转变。E公司是大型发电
目的:1.评估温清除痹汤治疗活动期类风湿关节炎寒热错杂证患者的疗效和安全性。2.探讨温清除痹汤治疗活动期类风湿关节炎寒热错杂证患者发挥抗炎、止痛、抑制免疫、改善微循
本文选取10个省级层面发布的促进媒体融合发展的相关政策措施,运用政策工具理论对其进行分析。研究发现:省级媒体主管部门将注意力更多地放在传播手段融合目标方面,更高维度
光照条件主要包括三部分:光照强度、光照颜色以及光源方向。如果已知场景中的光源方向,在进行物体跟踪和物体识别的过程中能够避免阴影的干扰,在增强现实中可以得到更真实的
从素可泰时期(泰文:(?),英文:Sukhothai)中泰两国开始友好往来。至今,华人已进入泰国百余年。以前泰国对外来人口持一个很开放的态度,并不限制外国人进入泰国。现在在泰国社会中,华人与泰国本地人已经融合在一起,成为密不可分的群体。华人对泰国的发展有很大的影响,如在社会、文化、经济、政治和教育等方面,华人对泰国做出了很大的贡献。本论文针对1935-2004年的泰国游记来进行研究,对游记作品中的
<正>多媒体辅助教学作为现代化的教学手段,与常规教学手段相比,有它独特的优势,它能生动形象地再现事物发生和发展的过程,从而在小学数学学科的抽象性、逻辑性与学生思维的具
首先对卡马西平临床合并用药的临床疗效进行相关阐述,其次对其用药不合理产生的临床不良反应加以总结,在提高其用药合理性的同时,阐述卡马西平临床合并用药的治疗作用,提出合
目的探讨55岁以下中青年冠心病的相关中西医致病因素以及发病特点,以更好地指导临床治疗。方法采取调查研究的方法,于2018年1月至2019年4月在河北省沧州中西医结合医院以经冠
近年来,随着我国教育行业的发展,学校基建建设规模也在不断扩大。但同时,腐败问题也频繁发生。在党和国家强调廉政建设的背景下,学校也应当积极响应国家号召,做好廉政建设。