基于时序行为和标签关系的个性化新闻推荐系统研究

被引量 : 5次 | 上传用户:jiebaidexue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上海量、实时更新的新闻,满足了不同用户的新闻阅读需求。据中国互联网络信息中心的最新统计,83%的互联网用户习惯于在互联网上阅读新闻。随着越来越多的用户通过移动设备和无线网络接入互联网,如何帮助互联网用户在海量新闻中寻找到其感兴趣的新闻变得愈发必要和迫切。个性化新闻推荐技术作为解决互联网新闻过载问题的重要的手段,得到工业界和学术界高度重视,许多相关的算法与系统被不断提出和开发,个性化新闻推荐算法已成为数据挖掘与机器学习领域的一个研究热点。个性化新闻推荐算法根据用户浏览行为和新闻的内容,采用各种数据挖掘技术,分析并挖掘用户的兴趣,主动地向用户推荐其感兴趣的新闻。个性化新闻推荐算法不仅能够帮助用户发现其感兴趣的新闻,而且可以提升用户对网站的满意度,增加用户粘性。针对现有个性化新闻推荐算法很少考虑用户浏览行为的时序特性以及忽略了蕴含丰富信息的新闻标签的作用与价值的问题,本文对个性化新闻推荐算法展开了研究,主要创新工作如下:(1)在用户浏览新闻的过程中,用户浏览新闻而产生的行为数据是一种时间序列数据。但是,现有的新闻推荐算法很少考虑用户浏览行为的时序特性,从而造成在预测用户将要阅读的下一则新闻时表现出较差的性能。为了解决上述问题,本文考虑用户行为的时序特性和用户所处的上下文,提出了时序性协同过滤新闻推荐方法。与该方法相匹配,在相似度计算方法上,本文提出了一种名为时间依赖性相似系数的方法,弥补了传统相似度计算方法在计算长期用户和短期用户的相似度方面的不足。(2)尽管新闻的标签向用户展示了与新闻的内容密切相关的核心内容,但现有的个性化新闻推荐算法通常使用关键词向量或者主题分布对新闻的主要内容进行特征化表示,忽略了标签的作用和价值。基于标签的信息量和标签概率关系图中标签的度,本文提出计算标签权重的方法,用于区分不同标签的重要性;基于标签间共同出现的模式,采用条件概率的方法,计算两个标签在不同方向上的相关度;在此基础上,通过标签向量对新闻的内容和用户阅读偏好进行特征化表示,提出了基于标签概率关系图的个性化新闻推荐算法,向用户推荐与其阅读偏好相关的新闻。(3)基于本文提出的个性化新闻推荐算法,本文实现了基于标签的个性化新闻推荐系统,不仅向用户推荐符合其阅读偏好的新闻,同时推荐与其阅读偏好相关的新闻,从而帮助用户发现新的阅读兴趣,增加了推荐结果的多样性。此外,本文采用多维评价指标,通过广泛的实验,对本文提出的个性化新闻推荐算法的性能进行综合评测,验证本文提出的个性化新闻推荐算法的优越性。
其他文献
新生儿高胆红素血症主要由胎儿型红细胞破裂释放胆红素所致,是新生儿期常见疾病。该病发病率高,并呈逐年上升趋势,目前居新生儿住院疾病首位,严重危害新生儿健康。新生儿高胆
目的通过检索常用的感冒类非处方中成药不良反应发生情况,为安全使用感冒类非处方中成药提供参考。方法规定中成药范围包括:中西药复方制剂。采用回顾性研究方法,通过检索药
本文通过对传统成本管理理念在高新技术企业发展中面临的危机及高新技术企业产品生命周期各阶段成本的特点的分析,从理论高度探讨了对高新技术企业进行产品生命周期成本管理
初中数学课堂采用师生互动教学模式,可以极大的活跃课堂气氛,营造出轻松活跃的学习氛围,使学生以积极热情的态度参与到初中数学课堂的教学中来,充分发挥出学生自身的课堂主体
中小企业是我国国民经济的重要组成部分,但其在发展过程中面临许多问题,其中的一个重要问题是融资困难。本文以机器设备融资租赁作为切入点,利用中小企业机器设备融资租赁调
目的确定人参强心滴丸最佳成型工艺。方法采用熔融法,将药材提取物分散于熔融的基质中混合均匀,滴于不相混溶的冷凝液中,以滴丸的圆整度、硬度、均匀度、粘连、丸重变异系数
<正>随着"班班通"工程的逐步实施,交互式电子白板辅助课堂教学已成为课堂教学的主要模式。结合新课程标准对中学语文阅读教学朗读、阅读范围、欣赏、感悟的要求,交互式电子白
建材是我国经济发展的重要基础产品。自上个世纪末,我国的城镇化改革全面推进,房地产业迅速崛起,带动了建材市场的快速发展,21世纪以来,我国建材市场获得了更大的发展空间,行
我国制定的《普通高中生物课程标准(实验)》中将“提高每个高中学生的生物科学素养”确定为课程标准实施的核心任务。科学素养的形成以科学知识和科学方法为基础,而科学概念
枳椇(Hovenia dulcis)为鼠李科枳椇属植物,是一种广泛分布的野生或半野生树种。研究发现枳椇果梗富含多酚、黄酮等物质,具有很好的抗氧化作用。本研究以枳椇果梗为原料,优化