论文部分内容阅读
从一个巨大的全球新闻来源中在线阅读新闻已经成为阅读新闻文章的一种流行方式。新闻推荐系统帮助用户管理如洪水般的新闻,根据用户对新闻的偏好而不是按顺序展示新闻给每一个用户。随着互联网提供了快速访问世界各地新闻的能力,现在基于Web的新闻服务器,比如说谷歌新闻和雅虎新闻已经越来越被大众所熟知和接受。随着新闻文章每天巨大的产出量,摆在在线新闻提供商面前的一个最大问题就是如何在充分利用用户信息和新闻文本信息的前提下帮助用户最大可能的找到与用户偏好相似的新闻文章,因此推荐新闻已经成为一种很有研究前途的方向。虽然个性化的新闻推荐已经取得了很多最新进展,但是仍旧会面临不小的挑战:新闻的流行度和时效性都会随时间变化比较大,这有别于商品和电影等;在大多数情形下,阅读的新闻文章之间并不是独立的,也就是说现在浏览的新闻可能会影响随后的阅读;不同新闻之间潜在关联以及新闻潜在的特殊属性都没有得到充分的利用。总之在现有的研究算法中,个性化新闻推系统的很多问题还没有得到有效的解决。为了解决以上问题,本论文对传统的推荐算法分析与研究,提出了改进的新闻推荐系统框架,主要研究内容包括下面若个方面:⑴针对目前推荐算法冷启动难题和稀疏性难题以及目前相似度算法的不足,我们充分分析了新闻潜在的特殊属性,同时探索新闻不同潜在属性融合的可能性,进而提出融合新闻文本、用户行为以及新闻命名实体的一种改进的相似度算法,这种算法同时考量了时间效应以及冷门新闻效应对推荐结果的影响。⑵充分分析了用户兴趣偏好的演变对推荐结果的影响,进而提出一种融合用户长期兴趣偏好和用户短期兴趣偏好的用户兴趣模型来充分表达用户阅读兴趣。⑶采用用户长期兴趣和用户短期兴趣的双层过滤策略,提出一种用户长期兴趣偏好以及用户短期兴趣偏好相融合的新颖推荐算法。根据聚类算法划分新闻分组,利用长期用户兴趣过滤符合用户偏好的新闻分组,利用用户短期兴趣从每一个选取的新闻分组中过滤特定新闻给特定用户。⑷在聚类方法和用户兴趣模型的基础之上,研究如何实现两种方法的融合,产生一个新颖的新闻推荐框架。最后在数据集上进行仿真实验并对实验结果分析,实验表明本论文提出的基于考量新闻潜在属性以及用户兴趣变化的新闻推荐算法,相对于传统的新闻推荐算法,可以提升新闻推荐系统的推荐精度。