基于Spark的API推荐系统研究

来源 :河北工程大学 | 被引量 : 5次 | 上传用户:xia650
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会不断进步,互联网信息量呈指数增长,用户获取需要信息的途径愈加困难。作为近几年新兴的一种轻量级互联网应用服务,Web API服务可以构建面向各种客户端的服务,并且可以自由复用及组合,使用户更加轻松的使用各种功能。随着Web API服务逐渐被公众所使用,如何帮助用户更加快速地寻找与其需求相匹配的服务成为难点。推荐系统的出现解决了这个问题,但是使用传统推荐系统在Web API服务的数据量和用户量逐渐增加的情况下,会对推荐系统造成巨大压力。基于Spark的计算框架被广泛应用于海量数据的处理,并为面向海量Web API服务推荐系统的研究提供了新的机遇和挑战。本文的主要研究内容是针对Web API服务进行个性化推荐,其方法是通过解决传统算法中数据稀疏造成最终结果不够准确,以及原始数据的分类不标准造成结果产生误差的问题,通过改进相似度计算达到提升面向Web API推荐系统的准确性,同时结合Spark计算框架更好适应于海量Web API数据的处理,以及提高推荐系统的执行效率。本文的重点研究方面有以下几点:(1)本文重点提出了两种改进算法,包括改进的协同过滤算法和改进的基于内容的推荐算法。其中改进的协同过滤算法是通过改进的空值填补法和均值中心化方法解决数据稀疏性问题,然后通过计算相似度时引入用户间信任度和关注度提高推荐结果准确率。改进的基于内容的推荐算法通过引入Fasttext算法重新对数据进行分类解决原始数据不准确问题,然后引入TFIDF算法提取文本关键字提高计算相似度的准确率。(2)在Spark计算平台中将两种算法并行化,详细的介绍了并行化过程,展示了并行化后实验的对比结果。其结果表明并行化后的算法其运行速度得到大幅度提升,故针对Web API服务的个性化推荐效果更能满足用户的需求。最后本文对Web API服务的推荐系统进行了架构分析与设计,包括需求分析、系统整体架构以及算法的实现流程。
其他文献
<正> 浙江省萧山市职业高中探索了&#39;校服招标学生选&#39;的机制:9名学生代表组成招标主持人及招标组,对5家服装厂竞标的16套到校展出的校服,通过无记名投票选中一种75元/
期刊
初学几何的同学总感到证明题目太难了 ,苦于找不到证明方法 ,分析不清证明的思路 ,寻找不到证明的途径 .在几何教学中 ,我感觉重点应引导学生学会分析、解决问题的方法 .教学
目的探讨中药熏药结合中医定向透药在治疗腰椎间盘突出症中的作用。方法选取本院收治的183例腰椎间盘突出症患者作为研究对象,随机分为对照组和观察组,对照组给予常规治疗和
<正>佛拉萨,人的纯净之土,人的夙愿之魂。你的轮回之始,我的无量之恩。佛、拉、萨。静心静气,分三步,上齿轻扣下唇,气冲霄汉;舌底下颚,气若游谷;双齿微开,气若吐虹:佛——拉
真空罩为箱体类零件,文章着重对真空罩制造,从铸造工艺——机械加工工艺——铣削加工工艺——钳工加工工艺——立式加工中心加工工艺——产品质量检测工艺整个过程进行探析。
自媒体时代,微博广为大众使用,人人都可以成为"新闻记者"。但由于大众缺乏专业素养,造成一些消息在传播时变异为谣言。这引起了关于微博"把关人"的思考。要改善把关人弱化的
丽水畲族民间重视通过订立契约实现物权变动,留下了数量可观的契约文书。这些契约文书不仅反映了畲族先民物权的变动过程与类型,而且体现了畲族民间物权变动惯例,物权变动过
气象经济与气象经济学在经济社会中的作用越来越大,并越来越受到重视。通过分析气象与经济社会的关系,阐述气象经济学的涵义及其特性,并对其现状和问题进行分析,提出了构建气