【摘 要】
:
在信息化时代,每个互联网用户都可以在网上发布内容。但是这导致各大应用程序上信息过载,人们难以在内容丰富的应用中很快找到自己感兴趣的内容,于是各大视频应用开始使用推荐系统。推荐系统能够主动推送用户可能会喜欢的内容,进而解决视频应用内信息过载,以及用户不知道自己想看什么的问题。推荐系统需要根据已有的用户数据进行推荐,但是一旦数据难以收集,就会出现数据稀疏的问题。传统的视频推荐算法在面对稀疏的数据时表现
论文部分内容阅读
在信息化时代,每个互联网用户都可以在网上发布内容。但是这导致各大应用程序上信息过载,人们难以在内容丰富的应用中很快找到自己感兴趣的内容,于是各大视频应用开始使用推荐系统。推荐系统能够主动推送用户可能会喜欢的内容,进而解决视频应用内信息过载,以及用户不知道自己想看什么的问题。推荐系统需要根据已有的用户数据进行推荐,但是一旦数据难以收集,就会出现数据稀疏的问题。传统的视频推荐算法在面对稀疏的数据时表现较差,而且目前大部分视频推荐系统只是根据用户信息和用户历史的行为记录进行推荐,对视频本身的特征不能有效利用。针对这种情况,本文采用了一种能够融合视频特征的XDeepFM模型,并基于此模型设计了一款短视频推荐系统。本文的主要研究工作如下:1.研究了现有的推荐算法,并分析了其存在的问题。传统的推荐算法存在数据稀疏,冷启动以及推荐内容多样性不足等问题。而单纯基于深度学习模型的推荐算法虽然在一定程度上缓解了这些问题,但是可能会因为忽略重要的低阶特征组合而导致推荐性能降低。2.重点研究了XDeepFM模型。该模型既有线性部分,又有深度学习模型。它不仅能够发现数据间的相关性,还能够挖掘出数据的高阶特征以及稀有特征,从而在提高推荐性能的同时,丰富推荐内容的多样性。并且它还能够自动构建特征间的交叉,降低人力成本。3.使用尺度不变特征变换算法(SIFT,Scale-invarialt feature transform)获取视频关键帧特征。之后将视频特征,用户信息和用户行为数据一起作为XDeepFM模型的原始输入特征,形成融合视频特征的XDeepFM模型。4.与多个不同的模型进行对比实验,计算各个模型在相同数据集下的AUC(Area Under Curve)和推荐列表的多样性。实验结果显示融合视频特征的XDeepFM模型能够有效利用视频特征,提高推荐性能,丰富推荐内容。5.基于融合视频特征的XDeepFM模型实现了短视频推荐系统。
其他文献
依托第五代移动通信网络的应用部署和物联网的快速发展,大量低功耗设备的应用越发广泛,从而使无线携能通信技术越来越受到关注。无线携能通信技术可以利用同一个频段,同时对能量接收机和信息接收机进行能量和信息传输,在保证通信质量的同时解决低功耗设备的能源问题。但是,由于使用的无线频段越来越高,无线信号会因距离或者障碍物等因素限制信号的覆盖范围。另外,在物联网应用中,系统中的信息接收机往往较密集,严重的信号干
移动机器人作为当前科技领域的集大成者,集成了电子信息、计算机科学等多个学科的高精尖技术,其软件系统由感知系统、决策与规划系统、控制系统等多个模块组成,关键技术的重点难点之一就是决策与规划。本文首先介绍了一种结合端到端路径规划技术的自主建图方法,并对其中采用的端到端路径规划算法进行了改进,最后通过仿真实验验证其可行性。针对项目要求的清洁机器人,本文提出一种基于回溯法的双向完全遍历路径规划方法,对工作
现有制造车间的大型设备复杂度高,越来越依赖监控系统对其进行实时性管理。而伴随着车间智能终端设备的迅速增加,目前依靠云计算的设备监控系统所需传输的数据量越来越大,车间需要紧急响应的告警信息容易出现延迟,导致设备不能正常运行,严重会造成设备停机等问题,进而影响车间生产线的生产效率。因此,加入边缘计算模型的云边协同数据处理方式逐渐得到重视。当前基于云计算的智能车间设备监控通常把监控数据全部传输到云端进行
超分辨技术是计算机视觉等领域的重要与热门研究方向,在医疗成像等众多领域有广泛的应用。基于深度学习的超分辨重建技术在近几年中发展迅速,神经网络模型对高分辨图像的重构性能越来越强,充分体现了使用深度学习解决超分辨任务的优势。但基于深度学习的超分辨重建技术在提升系统性能时很多是依靠堆叠大量神经网络和设计各种复杂的网络来实现的。同时训练后得到的部署模型存在推理时间长、参数量多等问题。这导致了设计的许多神经
深度预测和相机姿态估计一直以来是计算机视觉领域重要的研究方向之一,是指计算机通过二维图像估计出场景的深度信息和相机姿态信息,广泛应用于自动驾驶、服务型机器人和无人机等人工智能领域。传统基于几何的深度预测方法和相机姿态估计方法虽然在一定程度上能得到场景的深度信息和相机的姿态信息,但是存在计算过程复杂、场景适应性差等问题。目前,基于深度学习的深度预测和相机姿态估计方法一般以卷积神经网络和循环神经网络为
受脑科学、神经计算科学研究的启发,脉冲神经网络作为模仿生物大脑机理的计算模型,在仿生视觉、嗅觉、记忆等应用场景中暂露头角,并逐渐成为脑模型研究的主流。脑科学研究表明,生物大脑的神经元突触个数比其神经元数量大3-4个数量级,生物大脑每周期的生物实时处理时间大概为1-10 ms,大脑工作过程伴随着大量脉冲信号的传递。因此,脑模型的生物实时仿真可抽象为超大规模的图计算和海量微小脉冲包的通信问题,给传统冯
随着大数据时代的飞速发展,现实生活中的许多数据呈现出高数据量和高维度的特点。由于这些现实数据含有特定的物理意义,通常都具有非负性,被统称为非负张量数据。现实的非负张量数据经常呈现“高维,大规模和异构”等形态,其有价值的信息蕴含在复杂的潜在结构中,随着数据规模的不断增大,数据分析所需的存储和计算成本也相应增加。此外,流形学习技术指出,观测到的数据实际上是通过内在流形结构映射到高维空间的。但现有的经典
由于可以制成体积小、重量轻、能量密度大的可穿戴便携产品为数码设备、动力汽车等提供能量,锂离子成为了是当下应用最广泛的储能设备。电极材料是锂离子电池的重要组成部分,其容量也是决定电池性能的关键因素。为满足新能源汽车、航空航天及国防等高耗能场合对于动力电池的需求,研发高容量、环保且性价比高的负极材料显得尤为重要。锡基材料因为价格低廉、无毒且具有高理论比容量(Sn:994m Ah/g,SnO2:1494
在当今的大数据时代,个人隐私数据的丢失尤为严重,这给个人和社会产生了非常恶劣的影响。因此,研究在大数据环境下如何保护数据安全已经成为最重要的问题之一。只有处理好信息安全的瓶颈,信息技术才能讯速、广泛地发展。本文旨在研究如何快速将敏感数据从成千上万的数据中区分出来,并对敏感的私有数据进行加密以实现保护的目的。目前,对于大数据加密算法领域,普遍存在着较短的密钥长度、加密速度慢等缺点。本文在研究原有的数