基于Hadoop的Slope One视频推荐算法的研究与实现

来源 :郑州大学 | 被引量 : 0次 | 上传用户:superficalness
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、云计算时代的到来,用户已经不再为视频资源发愁,取而代之的是如何在众多资源中找到符合自身兴趣的信息。因此,既可节约用户时间又具有个性化的推荐系统成为一种迫切需要。良好的推荐系统是通过对用户的历史行为信息数据进行分析研究,建立其兴趣挖掘模型从而向其快速推荐感兴趣的个性化节目。协同过滤是目前最常用的推荐算法,其主要基于用户对项目的评分数据来挖掘用户的兴趣爱好,但它存在诸如数据稀疏性、用户兴趣随时间变化、大数据环境下的可扩展性等问题。为使用户获得更好的体验,针对以上问题,本文提出一种基于Hadoop平台的改进Slope One算法。具体研究工作如下:1.基于用户时间信息的Slope One算法的改进。Slope One算法是协同过滤推荐算法的一种。该算法基于不同用户对相同喜爱项目间的评分偏差来预测用户对未评分项目的兴趣程度。虽然算法较为简单,但是未考虑用户兴趣的变化和其他因素对评分预测产生的影响。所以本文在用户评分预测模型中引入了用户对项目产生行为的时间信息,以提高推荐质量。2.基于项目相似性多个权值的Slope One算法的改进。为了提高推荐的多样性和准确性,本文在加权Slope One算法的基础上先对皮尔逊相关系数公式进行改进,将改进后的项目相似度作为一个权值参与到评分预测中。然后在计算项目间类别信息相似度时对杰卡德系数法进行了改进,并将改进后的杰卡德系数法也作为权值参与到评分计算中。最后融合了改进的时间信息与项目多权值的Slope One算法,即组合Slope One推荐算法。3.基于Hadoop平台的改进Slope One算法的实现。为了提高推荐质量,基于Hadoop集群环境,利用MapReduce任务分解模型和HDFS文件存储系统实现了改进的Slope One推荐算法。4.基于MovieLens数据集对算法进行了验证。实验结果表明,改进的Slope One算法能够明显提高推荐的准确度。而且对于大规模数据集,集群的分布式环境对于算法的验证有更好的扩展性和执行效率。
其他文献
<正>宋朝年间(公元1066年),黄河发洪水,冲垮了河中府(今山西省永济县)城外的一座浮桥。这座浮桥是用许多空木船一条紧靠一条排起来,再铺上木板架起来的,为了不让浮桥移动,人
期刊
针对IEC61000—4—3标准的要求,提出了一种新的利用LabVIEW软件开发环境构建电能表射频电磁场抗扰度测试系统的方法。明确了系统的软硬件组成,分析了闭环校准、扫频测试、点频
文章针对我校电气工程与智能控制专业人才培养的现状,在专业定位分析的基础上,本着理论与实践并重的原则,优化课程设置,构建了专业课程体系和实践教学体系,突出了对应用型专
目的探讨SOX11和TFE3在鉴别诊断胰腺实性-假乳头状瘤(SPN)和神经内分泌肿瘤(PNEN)中的价值。方法回顾性分析2015年8月至2018年8月首都医科大学附属北京友谊医院收治的12例SPN
目的选择更适合门诊采血室的全自动智能采血系统,降低护士工作强度、保障护士安全,减少采血差错,方便检验自动化操作。方法比较两种全自动智能采血系统在门诊采血室中的应用
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探究中性粒细胞CD11b、1,25-(OH)2VitD 3、γ干扰素(INF-γ)在小儿轮状病毒性肠炎(PRE)中的表达及与免疫功能的关系。方法采用前瞻性研究方法,选取2017年9月至2019年9月
用有限元软件ABAQUS模拟了3个室内缩小比例的在挡土墙与墙背填土之间设有聚苯乙烯EPS土工泡沫板的振动台试验。详细介绍了有限元数值模拟的方法,并把计算的EPS压缩变形与有限