基于回归策略的混合推荐算法研究及并行化实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:qwer2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和移动智能终端的兴起发展,人类正面临严重的数据过载。为了解决这一问题,推荐系统应运而生。推荐系统通过分析用户的偏好和行为信息,建立用户模型,主动为用户推荐其可能感兴趣的信息。然而由于数据规模的急剧增长,推荐系统面临严重的稀疏性和可扩展性难题,推荐性能急剧下降。结合当前推荐系统所面临的困境,本文提出了相应的改善措施。主要工作可概括如下:1.针对数据稀疏问题,本文将目前推荐系统常用的隐语义模型获得项目特征向量,然后分别通过线性回归和支持向量回归算法获得用户兴趣向量,并据此预测用户评分;最终得到两种算法模型,分别称为基于隐语义的局部加权线性回归混合推荐算法(LR-LFM)和基于隐语义的支持向量回归混合推荐算法(SVR-LFM)。其中LR-LFM适用于对实时性和模型可用性要求更高的情况,而SVR-LFM则适用于数据稀疏时追求推荐精度的场景。2.针对可扩展性和实时性问题,本文选取了更适合迭代运算的Spark计算模型实现了上文提出的SVR-LFM算法的并行化形式。通过分析该算法并行的数据依赖和通信开销,给出了详细的并行化思路和实现过程。3.最后本文使用python语言实现了前面提出的算法,并通过MovieLens数据集在实际平台上进行模型参数的训练及最终算法性能的检验。实验数据显示,本文提出的算法在稀疏数据情况下显著提高了算法精度,并行化后的SVR-LFM算法具有接近线性的加速比。
其他文献
目的 :近年来,越来越多的运动员在备赛时期都选择高原训练,也有大量运动员通过高原训练而取得优异成绩,因此吸引了越来越多学者的关注。现有研究多针对高原训练对运动员运动
会议
行人检测是计算机视觉领域内的热点研究问题之一。几十年以来,检测算法随着计算机硬件的发展不断进步,但在实际的生活场景之中,行人检测算法依然与人类自身的判别能力有着巨
高分辨SAR图像相比于中低分辨率SAR图像,能够对地物更清晰的呈现。但由于同种物体间的细微差异,即便同种地物也具有不同的反射回波,在图像中呈现出较大的差别。传统的中低分
随着科技的迅猛发展,大数据、人工智能、分布式计算、区块链等技术的不断涌现,使得人们的学习和生活更加方便快捷。但在这些技术产生的背后离不开数字图像的分析和处理。数字
风险控制管理与企业常规运营机制中的核心组成部分,在当代企业管理理念中起到至关重要的作用。通过建立企业风险控制体系,增强企业的风险防范意识,提高企业防范风险的能力。
高熵合金也称多主元合金,具有较大的混合熵和比传统合金更优异的性能,是近年来金属材料领域的研究热点之一。45#钢有广泛的应用,但硬度低、不耐磨,在船舶等海洋环境条件下使用时易腐蚀而导致失效。本文采用激光熔覆的方法对45#钢表面进行激光改性处理,制备不同元素的CoCrFeNiM_x(M=Al、Mo、Ti、B;x=0.5,1,1.5)高熵合金涂层,并进行退火处理(700 oC×5 h、900 oC×5
自然发酵酸菜和自然发酵酸奶是我国传统的发酵食品,酿造和食用历史悠久,其中蕴藏着丰富的乳酸菌资源。本研究中,我们的目的是对东北地区酸菜中分离到的15个乳杆菌潜在新种和西藏地区酸奶中分离到的1个乳杆菌潜在新种进行多相鉴定,确定它们的分类学地位。采用的鉴定方法主要包括16S rRNA基因序列分析、pheS和rpoA基因序列分析、基于全基因组测序的ANI和dDDH分析、API50CH糖发酵实验、细胞壁氨基
伴随着半导体技术、微电子技术和计算机技术的发展,无线通信技术得到了迅猛的发展和广泛的应用。目前世界上的无线通信正处于一个蓬勃的发展时期,不断改善着人们的生活方式,
随着科学技术的飞速发展,切换系统无论是在工程应用领域还是现实生活中都有诸多应用,因此,切换系统的研究有重要的理论研究意义和广泛的工程应用前景。本文基于模糊自适应反
蜱是传播病原体种类最多的吸血节肢动物之一,对人类健康造成严重威胁。蜱虫在人畜身上持续吸血,并分泌唾液将病原体传播到宿主体内。蜱分泌的唾液中含有很多具有生物学活性的