【摘 要】
:
随着互联网技术的发展,大数据时代的到来,电影、音乐、电子商务等商业和娱乐网站在人们的日常生活中逐渐占据了重要地位,“信息超载”现象也日益凸显,传统推荐算法已经无法满
论文部分内容阅读
随着互联网技术的发展,大数据时代的到来,电影、音乐、电子商务等商业和娱乐网站在人们的日常生活中逐渐占据了重要地位,“信息超载”现象也日益凸显,传统推荐算法已经无法满足用户的个性化需求。协同过滤推荐算法由于其个性化推荐程度较高已被广泛使用,但用户数量和项目数量的急剧增长导致该算法面临的数据稀疏性、冷启动等问题愈发严重。同时,在大数据环境下的推荐算法由于计算量过大也存在着可扩展性和实效性问题。针对上述问题本文重点研究基于信任网络的协同过滤推荐算法,主要研究内容如下:(1)研究基于内存的协同过滤推荐算法的优化。针对基于内存的推荐算法存在的数据稀疏性和恶意推荐问题,在国内外学者对信任网络研究的基础上,改进了信任度计算公式,同时为了缓解热门项目对推荐算法性能的影响,改进了传统的用户相似度计算公式。最后对Slope One算法进行优化,得到STSO算法。实验结果表明该算法有效地缓解了数据稀疏性和恶意推荐的问题,明显提高了推荐精度。(2)研究基于模型的协同过滤推荐算法的优化。针对用户评分矩阵过于稀疏导致推荐精度下降的问题,选择对性能较好的基于概率矩阵分解模型的推荐算法进行改进。主要思想是在根据信任传递规则计算用户相似-非二值信任矩阵的基础上,改进RSTE模型,得到了优化后的TransT-RSTE算法,以解决用户项目评分矩阵的稀疏性问题。实验结果表明该算法提高了推荐准确度,并且其性能也优于STSO算法,但STSO算法更适合于在线推荐。(3)采用Spark平台对改进后的两种算法进行并行化研究。针对大数据环境下推荐算法的可扩展性问题和实效性问题,提出在大数据处理平台Spark上对上述两种推荐算法分别进行优化,优化方法则是对两种算法进行并行化处理,同时设计了并行化实现过程,分别得到基于Spark的并行化优化推荐算法。实验结果表明,采用并行化方式优化后的两种算法性能更好,有效地解决了推荐算法在单机模式下由于数据量过大导致的可扩展性和实效性问题。
其他文献
电动自行车价格低廉且轻巧便捷,是配送行业最后一个环节的首选工具。无人驾驶能够提升送货效率、降低人力成本和减少交通事故。无人自行车可为配送服务提供一个理想的方案。
随着工业产业结构升级,机器人行业得到空前的发展机会,为了提升机器人的作业效率,基于视觉检测姿态估计的机器人控制技术迅速被广泛深入研究,有效引导机器人执行精准控制作业。因此,论文提出基于视觉检测的姿态估计引导机器人执行抓取控制,结合深度学习在视觉检测的稳定性优势,训练神经网络识别目标物,得到的输出结果引导机器人执行抓取操作。同时,搭建一个完整的智能机器人抓取系统对算法验证。论文探究了虚拟数据训练神经
滚动轴承作为旋转类机械设备的重要部件,常与轴、齿轮一起被应用于大型精密机械设备,其健康状态的优劣严重影响到机器整体的运行情况。若滚动轴承发生故障,轻则影响机械产品加工的质量,耽误产品的生产计划;重则机械设备系统瘫痪,造成严重的人身伤害和财产损失。对其健康状态进行在线监测、实现早期故障的检测是机械故障诊断的重要研究内容。由于滚动轴承通常不单独工作且工作环境极其恶劣,其振动信号拥有复杂的非线性信息,传
随着我国航天事业的发展以及高分对地观测系统的逐步完善,国产高分遥感数据的认可度越来越高,各个领域对这些数据的应用需求也越来越大,这对于社会经济的发展和国防安全都至关重要。虽然遥感数据应用中心能为广大的用户提供充足的数据支持,但其所提供的数据一般处于源数据阶段,对大部分的应用需求不能有效满足,需要用户自行处理后才能应用。而从数据的筛选到每一景影像处理完成,都需要耗费大量的时间和人力,这大大限制了国产
随着全世界能源消耗量的与日俱增,人类迫切需要寻找化石能源以外的可再生能源形式。风能由于其在资源分布、开发难易程度等方面的优势,成为了过去十年中增长最快的可再生能源类型。在风电机组的单机容量达到10兆瓦级别以后,对其可靠性的要求越来越高。为了解决由自然风的湍流波动引起的机组传动链载荷波动和高故障率问题,一种新型的机械液压混合传动方应运而生。这种传动方式能够通过行星轮系对功率流的合理分配,实现液压系统
目前,随着视觉SLAM(Simultaneous Localization and Mapping)技术被越来越多的应用于各个行业和领域,对视觉SLAM技术的时效和精度也有了更高要求。虽然近年来基于视觉的SLAM
随着云计算技术的发展日益成熟,越来越多的企业将自身业务“云”化,云计算服务提供商的数据中心规模也随之扩大。与此同时,数据中心中部署的服务器以及网络设备的种类和数量
通过黔东南州教育局倡导的“五环教学模式”,以提升少数民族地区普通高中生物学教学质量为宗旨,达成培养学生的学科核心素养为目标,于剑河县第二中学进行了为期一个学年的“五环教学模式”教学实践研究。通过对这一模式的教学实践的分析,以及教学效果的评价,明确了应用该模式在高中生物学教学设计中需要关注的重点;同时,也对新课程改革理念和目标有了更为系统的理解,确定该模式是可以在贵州省少数民族地区县级普通高中进行生
随着大数据的全面爆发,云计算时代的来临,云端数据的安全性变得至关重要,对于其安全性问题,主要体现在安全的存储和发生故障时的修复两个方面。现有的云存储系统中采用的技术
本研究以“穿着”类动词为例,将高日语水平的中国人日语学习者作为实验对象,进行了产出和受容实验,从而分析学习者的“穿着”类动词的习得状况。首先,本论文从学习者所使用到