论文部分内容阅读
随着互联网的普及,人们面临着大量的信息,但是有效的信息较少[1],这就造成了人们获得有效的信息困难的问题,因此推荐系统就尤为重要,论文提出了一种基于Spark Streaming实时、动态的推荐系统。论文主要研究的是:1)提出了一种基于Spark Streaming的实时推荐系统。2)研究了Spark数据倾斜、内存分配不均和卡顿问题,提出了一种根据Task大小分多级应用执行的策略。3)研究了基于模型的协同过滤算法,以及实时推荐系统的可行性并详细讲解ALS(交替最小二乘法)的思想,然后在Spark Stre