基于Spark Streaming实时推荐系统的研究与设计

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:xucaijuan302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,人们面临着大量的信息,但是有效的信息较少[1],这就造成了人们获得有效的信息困难的问题,因此推荐系统就尤为重要,论文提出了一种基于Spark Streaming实时、动态的推荐系统。论文主要研究的是:1)提出了一种基于Spark Streaming的实时推荐系统。2)研究了Spark数据倾斜、内存分配不均和卡顿问题,提出了一种根据Task大小分多级应用执行的策略。3)研究了基于模型的协同过滤算法,以及实时推荐系统的可行性并详细讲解ALS(交替最小二乘法)的思想,然后在Spark Stre
其他文献
自动化超参数配置方法在超参数调优过程中表现优异,但在超参数重要性分析方面还存在许多约束和限制。现有的超参数重要性评估方法多数局限于迭代构建模型,导致时间复杂度增加
"先使用,后付费"的营销方式导致电网公司电费回收不到位,难以支撑正常运转和获得基本效益。为了解决电力欠费对电网公司的不利影响,论文提出电力欠费预警智能预测的研究方法
针对如何进一步提升神经机器翻译精度的问题,提出了一种将生成式对抗网络(GAN)应用于神经机器翻译(NMT)的方法。构建一个条件序列生成对抗网,它包括两个对抗子模型,一个生成
目的探讨SNCG在膀胱癌中的表达情况及其临床意义。方法收集2006年1月至2009年12月中国医学科学院北京协和医院收治的140例具有完整临床病理及随访资料的膀胱癌手术标本,采用
宗教世俗化问题是上世纪宗教社会学界的重要议题。面对这一问题,作为世俗化理论旗手的宗教社会学家彼得·贝格尔在坚持现代性与宗教相对立的前提下,通过对西方的基督教传
<正> 七十年代末期,对大功率履带式牵引机进行了大量的研究,使其得到了相应的发展,但是,现代的工业技术水平、制造成本和市场状况实际上使牵引机的功率不能大于现在的功率。
针对电力系统在发生突发故障后失去同步性的问题,论文采用直接反馈线性化(DFL)技术设计了鲁棒非线性励磁控制器,实现了对电力系统稳定性的增强和容量调节。可以为特定的应用
传统k-means聚类算法是对某个时间片上的静态数据集合进行独立的聚类分析,但对于时间序列数据仅仅是多次静态聚类分析的重复应用。当数据量过大时,算法的时间开销将大大增加
数据分析方法能够发现更多潜在规律,数据挖掘技术在各领域的应用取得了巨大的成功。大量文献研究表明,基于数据分析的方法在教学过程和质量管理中显示出巨大的应用适应性。研