基于主题模型的资讯推荐系统的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:unicom_1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,整个互联网在快速发展和广泛应用下,网络信息已经处于一个过载的状态,然而有很大一部分用户接受最新的信息是通过网络的。相对于传统的新闻网站只是将热门的信息推送给用户,导致所有的用户获得的新闻都是一样的,用户不能在这些新闻中快速而有效的获取到自己真正关注的信息,而资讯推荐系统是应用推荐算法在用户的历史行为数据中挖掘出用户的偏好进行资讯推荐的,因此,个性化资讯推荐方法也获得了很大的重视。本文主要是在基于用户主题兴趣模型的基础上,计算出用户的兴趣主题模型分布,同时采用主题建模方法对新闻资讯文本内容完成建模,计算出文章的主题分布,最后采用基于内容的推荐算法,将用户主题分布与文章主题分布相似的文章推荐给用户。具体完成的研究工作有如下:(1)首先对个性化推荐中的重要算法和涉及到的技术进行分析并对比,最终得出本系统所采用的是基于内容的推荐算法。(2)本文采用的是基于移动用户画像的个性化推荐,其中是根据用户的用户画像分析出每个用户的在资讯上的兴趣特征,建立用户的兴趣模型,从而计算出用户的主题分布,另一方面,采用LDA(Latent Dirichlet Allocation)主题模型对大量新闻资讯进行机器训练得出文章主题,建立文章的主题模型,再计算出文章的主题分布,将用户的主题分布和文章的主题分布相似的进行推荐,推荐方法采用的是基于各权值的排序算法实现对用户推荐列表的更新。设计了离、在线模块及时的预测出非活跃和活跃用户的兴趣分布,能够做到实时的对这些用户做出推荐。(3)本文设计并实现了个性化资讯推荐系统,并对该系统做了性能和功能方面的测试,验证了系统的功能和性能,并通过数据来说明推荐系统的效果提升。
其他文献
柳州,跟所有安逸的南方小城一样,悠闲自在,适合安家,适合交友。这里的人,白天熙熙攘攘去工作,晚上三五成群地坐在一起享受美食。随便在巷子里的小摊一坐,就能悠悠然地谈论起
在当下预防医学的不断发展中,森林康养逐渐受到了学术界的重视与关注。对于森林康养而言,森林环境属于基本条件,更是森林医学研究的重要起点。由于森林康养在近些年来的多样
警戒犬是经过专门训练,为重要目标进行安全警卫的工作犬,主要用于后方仓库、导弹阵地、军用机场、首脑机关等军事目标以及政府机关、核心部门的警戒执勤任务。
大型军犬科目表演场面壮观,令人振奋,是展示军犬风采的主要形式,其训练的重要基础是集体延缓训练,对表演的成败起着关键作用。
要求犬主要对犬充满爱心、耐心,懂得犬的行为语言,最重要的是要讲原则。犬是活生生具有独立意识的,有时还是相当固执的动物。同一个犬种,甚至同一窝犬中每一头都是独立的个体,这就