【摘 要】
:
随着信息技术的高速发展,我们在享受互联网带来的便利时,也需要应对信息使用效率低的难题。面对海量的信息,性能良好的个性化推荐算法可以让用户快速找到自己感兴趣的内容,为企业带来巨大的经济效益。推荐系统数据集是基于用户的点击行为所收集的数据。在点击数据的采集过程中,由于误触、被夸张的标题或者图片吸引产生了大量的“假数据”,限制了模型的推荐效果。实际应用中能够采集到的用户行为数据是有限的,基于协同过滤的推
论文部分内容阅读
随着信息技术的高速发展,我们在享受互联网带来的便利时,也需要应对信息使用效率低的难题。面对海量的信息,性能良好的个性化推荐算法可以让用户快速找到自己感兴趣的内容,为企业带来巨大的经济效益。推荐系统数据集是基于用户的点击行为所收集的数据。在点击数据的采集过程中,由于误触、被夸张的标题或者图片吸引产生了大量的“假数据”,限制了模型的推荐效果。实际应用中能够采集到的用户行为数据是有限的,基于协同过滤的推荐算法难以从少量的训练数据中捕获用户和物品的高阶关系。针对这些问题,本文研究如何剔除“假数据”,如何从少量的训练数据中充分挖掘用户和物品之间的高阶关系,设计针对训练数据少的协同过滤推荐算法。主要研究内容和成果如下:针对如何消除推荐系统存在的“假数据”问题,提出了物品对用户的“吸引力”这一概念,并设计了一套吸引力数据采集方案。将吸引力定义为用户点击物品时注视点落在物品区域的分布比例,用户在点击物品时,计算物品对用户的吸引力,根据吸引力大小筛选掉“虚假”的点击数据。在设计的吸引力数据采集方案中,根据输入的用户视频,逐帧提取脸部、眼部图像并输入给注视点估计模型iTracker,得到估计的注视点。实验结果表明,在没有校准的情况下,注视点的估计误差稳定在1.8cm,在实际场景下采集吸引力数据具备可行性。针对如何从少量的训练数据中充分学习用户和物品之间的高阶关系问题,提出了基于注意力机制的超图卷积协同过滤推荐模型(AHGCF)。AHGCF模型利用超图结构建模用户和物品的高阶关系,使用注意力超图卷积网络更新节点的嵌入,引入Lambda Rank算法对推荐列表的顺序进行监督。对比分析了AHGCF模型与另外四个基于图神经网络协同过滤推荐模型的实验结果,相比基准模型中表现最好的LightGCN模型,AHGCF模型的召回率和精确率提高了9.21%和4.16%。设计了多组对比实验,探究各个模块和吸引力数据对AHGCF模型的性能影响。实验结果表明,模型在单个卷积层下即可达到良好的表现,在排序监督模块的作用下,AHGCF模型的归一化折损累计增益(ndcg)指标提高了5.29%。模拟产生吸引力数据,将吸引力数据以权重的形式引入到AHGCF模型,和仅使用点击数据相比,模型在召回率上提高了5.18%,ndcg提高了2.18%,吸引力数据明显提高了模型的推荐效果。
其他文献
<正>2022年央视的《开学第一课》以“奋斗成就梦想”为主题,分为“砥砺奋斗、接续奋斗、团结奋斗”三个篇章,聚焦党的十八大以来我国经济社会发展取得的历史性成就,邀请“时代楷模”、“八一勋章”获得者、载人航天工程总设计师、科学家、冬奥冠军、考古学家等奋斗者现身说法,讲述新时代的奋斗故事。节目值得一提的是,将课堂“搬到”了中国空间站的问天实验舱,通过AR技术1:1在演播厅现场还原实验舱。正在太空“出差
目标检测旨在对图片中的目标进行定位和识别,随着深度学习与高精标记数据集的快速发展,该视觉任务取得了重大进展。然而,很多情况难以获得训练样本,这极大限制了识别类别的种类,阻碍了目标检测的实际应用。因此,近几年零样本目标检测得到了广泛的关注。零样本目标检测任务是在测试阶段定位并且识别训练阶段未见过的类别。该任务不需要进行繁重的数据采集,只需要对每个类别进行语义信息标注。与完全监督目标检测相比,零样本目
行人检测是铁路周界异物入侵检测的一项关键技术。近年来,随着计算机技术的不断发展,提出了深度学习方法,显著提高了行人检测算法的性能。受高铁站台行人尺度变化大和遮挡的影响,现有行人检测算法的漏检率高,不能满足铁路周界异物入侵检测应用的要求。本文针对小尺度和遮挡行人漏检率高的问题,利用深度学习方法,开展对多尺度变化和遮挡鲁棒的行人检测算法研究,对提高行人检测算法的性能,保障高铁安全运行有重要的应用价值。
导弹阵地作为防空反导系统中重要的组成部分,对其进行侦察、定位和识别具有重要理论意义和军事应用价值。光学遥感影像具有分辨率高、成像幅面宽等优点,被广泛应用于目标侦察识别领域。论文以可见光遥感影像中导弹阵地内发射场坪、发射掩体和制导场坪三类子目标的检测识别为研究对象,构建了知识驱动和数据驱动的两类目标检测识别方法,力图解决现有算法应用于大幅面遥感影像时存在的“误检多”和“效率低”两个难题,实验证明了所
在无人机GPS信号拒绝的工况下,视觉导航作为新型的辅助导航系统。因为视觉导航算法自主性强,能高精度且高效率的完成辅助导航任务,而被广泛采用。其中基于特征匹配的无人机视觉辅助导航定位技术所需设备简单、定位精度高,能与惯性系统组合构成完全自主的高性能无人机导航定位系统而具有重大的研究意义。然而,当前的图像特征匹配算法具有不稳定,时耗高,鲁棒性差的问题。本文对已有图像特征匹配算法进行了深入地研究,并提出
随着航天技术的发展,太空成为了各国的必争之地。2016年中国航天白皮书明确指出,中国永久性空间站将于2022年前后建成并投入使用。空间站是我国的航天重器,因此必须要保证空间站的安全与正常运行。本文以挂载在空间站上,可以脱离空间站运动,并且具有维修空间站与识别航天器功能的巡视器为载体,研究航天器的识别与空间站的位姿估计。航天器的识别是保障空间站安全的前提,空间站的位姿估计是巡视器与空间站交会对接、巡
在义务教育阶段语文学科的四大核心素养中,语言运用是思维能力、审美创造、文化自信的基础,其重要性不言而喻。其中口语表达与交流是语言运用的主要组成部分,也是当前初中语文教学的主要内容之一。但在现阶段的语文教学中,学生的口语表达普遍存在不善言辞、词不达意、言之无序等问题,且目前对初中语文口语表达与交流教学的研究较少,缺少具体明确的、有针对性的教学策略。因此论文以初中生的口语表达与交流能力为研究对象,着力
心脏CT医学影像用于临床诊断心脑血管疾病具有重要意义。使用计算机断层扫描(CT)或其他成像技术获得精确的全心分割在心脑血管疾病的治疗中起着重要的作用。由于医生手动分割在面对海量医学图像数据时比较低效,因此借助深度学习技术中的神经网络通过多次学习图像特征,能够快速、准确的完成心脏自动分割任务具有重大意义。本课题将心脏CT图像分割算法作为研究对象,基于经典分割网络3D Unet提出一种新的3D深度监督
高维多目标优化问题是指同时优化三个以上目标的问题,广泛存在于实际应用中。演化算法拥有良好的全局搜索能力,在目标维数较低时有较好的求解性能。目标数量增多时,搜索空间变大,演化算法在求解过程中难以兼顾收敛性和多样性,导致求解效果不佳。因此,设计具有良好求解效果的高维多目标演化算法具有重要意义。环境选择是演化算法的重要组成部分,作用是选择适应度较好的个体参与演化。设计合适的环境选择策略可以平衡种群在演化
鱼雷具有隐蔽性高、射程远、威力大等优点,一直是海军装备中的核心武器。常规鱼雷发射速度约30m/s,在入水过程中可能出现器件失灵、跳弹和沉底等现象。目标检测与跟踪技术可以提供弹体姿态、位置、速度等信息,是支撑鱼雷入水稳定性研究的基础数据,因此设计高精度弹体检测与跟踪算法具有重要意义。传统的弹体位置数据是通过相机软件人工标记或传感器检测得到,实时性差且成本高。随着计算机视觉的发展,目标检测与跟踪技术为