基于协同过滤的个性化新闻推荐系统的研究与实现

被引量 : 63次 | 上传用户:yiluyouyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,信息呈爆炸式增长,用户逐渐由信息匮乏时代迈入了信息过载时代——过量信息反而使得用户无法找到自己需要的信息。为了方便互联网用户快速查找到所需信息,研究者提出了很多方法:门户网站,相对专业的信息源;分类目录,对热门网站分门别类;搜索引擎,只需输入关键词就能找到所需的信息。但用户需求不止于此,用户很多时候并没有明确信息获取指向,个性化推荐技术以其能够过滤大量用户不感兴趣的内容,帮助用户发现自身潜在喜欢的内容,得到了广泛应用。随着个性化推荐在电子商务领域大放异彩,个性化推荐技术逐步应用到其他领域,比如个性化新闻推荐。互联网步入到大数据时代,也给个性化新闻阅读发展提供了良好的机遇。新闻个性化推荐系统在理论研究中取得了长足进展,但仍有很多问题亟待解决:可扩展性问题、时效性问题、冷启动问题、数据稀疏性问题等,因此高效可扩展的个性化新闻推荐系统是论文的研究重点。本文的主要工作为:1.提出新的相似度计算方法,结合行为相似度和内容相似度,解决了传统相似度计算方法计算不准确或无法计算的问题,解决了协同过滤推荐数据稀疏性问题。2.提出新的适合个性化新闻推荐的可扩展聚类方法,更改了中心点选取方式和距离度量方式,使得新闻推荐系统的可扩展性大大提高。3.在个性化新闻推荐系统相似度计算阶段和最终推荐阶段融入了时间因素,保证了所推荐新闻的时效性。4.基于MapReduce模型实现整个协同过滤新闻推荐系统,使得个性化新闻推荐系统能够并行运行,可扩展性大大提高,适应了海量新闻和海量用户的个性化推荐需求。5.对聚类方法和个性化新闻推荐方法进行了实验,确定了相关参数,对最终基于协同过滤的个性化新闻推荐系统进行了功能测试,验证了推荐系统相关功能。论文首先分析了当前个性化推荐技术的研究现状和Hadoop云计算平台,阐述了论文提出的个性化新闻推荐的聚类方法和基于多维相似度的个性化推荐算法,最后给出了基于MapReduce模型实现的新闻推荐系统,并给出了详细的测试和评估结果。
其他文献
目的:观测痛泻要方对腹泻型肠易激综合征(D-IBS)模型大鼠结肠组织血管活性肠肽(VIP)及血管活性肠肽受体(VIP1-R)、水通道蛋白8(AQP8)表达变化,为痛泻要方治疗腹泻型肠易激综合
不管学习什么语言,词汇教学都是语言里最重要的一部分。词汇是语言的三要素之一,语音是语言的基础,词汇是语言的核心。不可否认,在进行汉语教学中,词汇教学是不可忽略、不能缺少的
目的通过研究急性缺血性脑卒中患者的中医证候现状调查,为急性缺血性脑卒中的中医药治疗提供治疗策略。方法对2017年7月至2018年6月在我院神经内科入院的急性缺血性脑卒中患
目的观察隔药饼灸对慢性支气管炎(chronic bronchitis,CB)模型大鼠支气管肺泡灌洗液(BALF)的中性粒细胞数量、肺组织细胞间粘附因子-1(ICAM-1)的mRNA及蛋白表达及p-p38MAPK蛋
经济基础决定上层建筑,上层建筑反作用于经济基础,这是社会发展的基本规律。市委二届六次全会要求,要妥善处理好改革、发展、稳定的关系,努力做到两手抓、两不误、两促进,以机构改
报纸
所得税对企业投资收益会产生较大影响,企业在进行投资选择时日渐关注所得税因素,文章针对所得税对企业投资决策的影响,提出基于所得税筹划的国内投资决策和海外投资决策,对我
目的观察并评价全胸腔镜肺叶切除术治疗临床早期非小细胞肺癌的临床疗效。方法按照随机分组原则,将75例早期非小细胞肺癌行全胸腔镜肺叶切除术的患者作为观察组,同期行常规开
立题依据:肿瘤转移是导致肿瘤患者最终死亡的首要原因,其过程主要包括肿瘤细胞从原发部位的脱离、肿瘤细胞随血液运行以及肿瘤细胞在转移部位的种植。目前,已有较多的研究发现
机器翻译系统是自然语言处理方面的重要研究方向之一,而译后编辑器也是一个重要的部分,它是提高翻译系统质量的重要方法之一。它的效率影响整个翻译系统的翻译质量。译后编辑器
混沌序列因其随机性和复杂性较好且难以被分析和预测,在进行流加密方面有着极大的优势,因此近些年学术界掀起了研究“混沌序列密码”的热潮。然而,从实用的角度来看,混沌系统应该