基于微博的个性化新闻推荐算法的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:gotomis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,人们获取新闻的方式也在发生显著地变化,从传统的报纸、杂志向新闻聚合网站发展,如国内的网易新闻、新浪新闻,国外的谷歌新闻、雅虎新闻等。人们从信息匮乏时代进入信息过载时代。对于这些新闻网站,如何高效精准的通过分析用户的兴趣给用户推荐新闻成为一个重要的任务。近年来,随着微博等社交网络的兴起,许多学者试图通过分析用户的微博和社交行为来构建用户的兴趣肖像库,基于微博的用户兴趣研究成为一个新的研究热点。本文对基于微博的个性化新闻推荐算法进行了研究和分析。主要工作内容如下:针对微博字数少的限制,本文通过词性标注和微博扩充等手段,扩充了微博的内容,从而更好地表示用户的兴趣;因为新闻属性的不完整和改善用户体验。本文设计了一个组合分类器对新闻文本进行分类并且设计了一个智能摘要算法来对新闻自动生成摘要;为了解决推荐系统的冷启动问题,受中国餐馆过程启发,本文提出了一种基于词向量的推荐算法。为了更好的挖掘用户和新闻之间的关系,本文通过使用张量来对用户和新闻建模,基于此提出了一种基于张量分解的推荐算法。通过实验对比,本文提出的基于词向量的推荐算法优于传统的基于关键词的内容推荐算法和基于主题模型的推荐算法,而且在用户发的微博较少的时候,算法的效果也很好,算法的容错性、健壮性较好。通过对用户和新闻间多种关系的挖掘,本文提出的基于张量分解的推荐算法,好于传统的基于同构网络的算法。本文还提出了一个完整的基于微博的个性化新闻推荐系统的设计方案,并详细阐述了系统设计与实现。通过对系统的实现,证实了算法的有效性和系统的可用性。
其他文献
肝癌是世界上最常见的恶性肿瘤之一。在我国,医院主要靠医生对医疗图像进行诊断,工作强度大,效率低,定量分析比较困难,影响了临床诊断的准确性。实现医疗的计算机辅助诊断对
随着电子商务技术的发展,推荐系统的被广泛地应用于发掘用户兴趣,以提高商品销售量,在实际的推荐系统应用中,基于邻域的推荐系统是最为常见的推荐模型。在传统的基于邻域的推
IPv6被认为是下一代互联网络协议核心标准之一。随着网络厂商和开发商逐渐在不同的平台上引入IPv6,IPv4和IPv6将长期共存。在IPv4向IPv6过渡的时期,同时存在两种网络,以及各种各
随着IT架构不断被部署到关系国计民生的支撑行业中,提供24×7的高可用性变得越发重要,对于运行着关键服务的系统任何形式的打断都将造成巨大损失。操作系统作为整个软件体系架
随着数字图像处理技术的快速发展和Internet的普及,数字图像的应用愈加广泛,对图像进行有效管理和查询的需求也越来越迫切。基于内容的图像检索(content-based image retriev
探究式学习是一种强调学生自主积极投身其中的学习方式,主要有自主探究、合作探究和启发探究等模式。国际上对探究式学习对人才的成长和发展所产生的重要影响已经产生了共识,我
CISC结构的微处理器指令功能复杂,指令长度、格式不定。设计高效合理的译码器是加快指令译码速度,提高指令流水效率,进而有效提高处理器性能的重要保证。 本论文来源于西北工
支持向量机作为一种基于统计学习理论的新型学习算法,能很好的解决有限样本情况下的学习问题。这种方法从理论上控制了机器学习的复杂性,同时具有良好的收敛速度和推广能力。它
在企业的信息化建设过程中,企业组织中的各个部门或者地区分公司根据自身情况,构建了不同的信息系统来维护与自己工作相关的数据,这样企业的整个信息资产就被分裂成通常所说