论文部分内容阅读
随着信息的不断膨胀,人们在处理信息过程出现越来越大的难度,无法进行信息过滤和快速的获取有效的信息,因此导致人们在信息流面前无法进行快速的决策。推荐系统能够有效的进行信息的处理和过滤,并将有效的信息推送给用户,从而缩短了用户获取信息的时间。新闻系统为用户提供了获取新闻的途径,随着新闻产生的速度越来越快,人们在获取感兴趣的新闻越来越难,加之现在的新媒体和自媒体的不断盛行,产生的新闻质量和可行度受到威胁,因此人们在进行新闻信息过滤中越来越难。因此在新闻系统中引入推荐系统对新闻信息进行过滤和处理后提供用户可以大大提高用户的体验,防止了用户在进行新闻阅读时产生的疲倦感。个性化新闻推荐系统可以根据用户浏览的的历史新闻信息进行用户兴趣分析,以及用户标签进行用户兴趣的挖掘,从而为用户推荐其感兴趣的新闻信息。本文正是在这样的背景下采用推荐算法向用户进行新闻推荐。本文的主要研究内容如下:首先对个性化新闻推荐系统的课题来源、选题目的以及国内外发展现状进行了详细的分析。为本文的研究指明了方向。在此基础上对系统涉及到的相关技术进行了详细的分析。其中包括推荐系统和推荐技术的详细分析。其次对系统进行了详细的需求分析和设计,对于个性化新闻推荐系统进行了详细的需求分析。从功能需求和性能需求两个方面展开。系统的设计主要从系统总体架构、流程分析和系统的功能模块设计。其中系统总体架构主要从系统架构和系统的网络部署两个方面展开分析。系统功能模块主要可以分为:用户管理模块、主题管理模块、个性化推荐模块和新闻展现模块。对这四大模块进行了详细的设计。最后对个性化新闻推荐系统进行了详细的实现和测试。本系统主要采用了java作为开发语言,Eclipse作为开发平台,数据库使用了Mysql,文件存储采用了HDFS。用户管理模据欸、主题管理模块和个性化推荐模块进行了详细的实现。用户管理模块主要从数据的增删改查等方面进行了详细的实现。主题管理模块主要通过中文分词和频繁挖掘进行主题模型发现,本文采用了Jcseg分词器和Apriori频繁集挖掘算法实现。个性化推荐模块则主要实现了用户或者新闻的相似度计算模块以及个性化推荐子模块。