基于深度学习和用户行为序列的推荐系统研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:slik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,为了应对互联网中每天爆发性增长的信息量,并且在海量数据中挖掘用户的兴趣点,研究者们提出了一系列的推荐模型以及智能化的推荐系统。随着深度学习的发展和引入,研究者们对推荐模型进行了进一步的研究,其中从用户行为序列中挖掘用户的兴趣偏好进行推荐是当今关注的重点。用户行为序列具体表现为用户对历史浏览物品的点击记录、评分记录,购买记录等序列信息,从中可以挖掘到用户兴趣的动态变化,并更精准地向用户推荐喜欢的内容。现有的大多数基于深度学习的推荐模型通常是将最近的用户行为序列进行池化操作或者使用循环神经网络提取序列的抽象表示作为用户的兴趣偏好,对于更长的行为序列挖掘的还不充分,难以捕捉到用户行为序列和用户偏好之间存在的内在联系。针对上述问题,本文的主要工作如下:(1)基于循环神经网络RNN和注意力机制提出了融合长短期用户行为的推荐系统召回模型LSIN(Long and Short Interest Network)。该模型将用户行为序列划分为长期和短期序列,使用循环神经网络进行编码,然后结合用户属性特征,用注意力机制抽取短期和长期用户行为序列中的用户兴趣特征,使模型在推荐系统的召回阶段进一步挖掘用户的兴趣偏好。(2)基于Transformer模型提出了推荐系统排序模型UBIN(User Behavioral Interactive Network,UBIN),其使用了Transformer模型编码用户的行为序列然后结合用户和召回的候选物品特征使用注意力机制抽取用户的兴趣偏好,使模型在推荐系统的排序阶段给出更加准确的推荐列表。(3)在MovieLens-1M和Amazon-Food数据集上与其他基线召回和排序模型进行对比实验,其中LSIN模型在Amazon-Food数据集上的召回率(Recall)和命中率(Hit Rate)相对于SDM模型提高了1%和1.2%。UBIN模型在两个数据集上的AUC值相对于DIN分别提高了2%和3%。此外,还探究了序列长度对LSIN和UBIN模型的影响以及主要模型参数对实验结果的影响。(4)在本文提出的召回和排序推荐模型的基础上,设计并开发了一个论文推荐系统。该系统从Papers With Code网站上收集并处理论文的相关信息,先使用融合了用户长短期行为的召回模型LSIN从数据集中召回用户最感兴趣的前几十篇论文,接着使用排序模型UBIN对召回结果列表按照点击率分数排序,最后返回论文列表给用户,此外还开发了为你推荐、首页推荐、物品相似推荐等功能,为研究人员提供更好的论文推荐服务。
其他文献
在大数据时代,数据的大量增长加速了机器学习的发展。近年来,深度学习作为机器学习研究的前沿领域,获得了广泛的应用。深度学习在为科学发展、经济发展和国家发展带来大量增益的同时,其对于数据的大量需求,也给社会带来了隐私泄露的风险。在深度学习的应用过程中,其数据收集、数据共享、模型训练和模型使用各个阶段都有隐私泄露的风险存在。因此在各个阶段进行隐私保护,有效防范深度学习应用过程中的隐私威胁具有很高的研究意
学位
目前,位置信息对于人们的生活愈加重要,比如在与他人共享位置时所需要的位置信息、在出行时所需要的路线导航、在商超购物时所需要的室内导航等诸多方面都要用到室外或者室内的定位技术。同时,在所有的位置信息需求中,室外位置信息的定位精度已经基本满足日常使用,但室内位置信息的定位精度却不尽人意,且定位难度较大。所以,室内定位相关的研究也显得愈发重要。当前,室内位置信息的定位技术主要有超声波、超宽带、RFID、
学位
随着新课程改革全面实施,传统教育理念和教学方式已不适用于现代教育发展趋势,更无法满足学生日益增长的学习需求.尤其数学作为初中教育重要学科,需要教师在核心素养背景下健全完善教学体系,为学生营造自主、探究、合作的学习氛围,改变以往单一沉闷的课堂气氛,增强学生分析问题和解决问题的能力,提高数学教学质量,为长远发展奠定坚实基础.对此,本文试从多方面分析基于核心素养下初中数学教学策略,望给予教师教学以参考.
期刊
近年来,随着工业设备对高质量和低维护成本需求的增加,智能监控的故障诊断逐渐成为一个重要问题。得力于无线传感器网络、并行计算和数据科学的发展,深度学习已经广泛应用于旋转机械的故障诊断。基于这样的背景下,越来越多的研究者希望通过机器学习算法解决此类问题,近些年,部分研究学者针对于滚动轴承的故障诊断提出了一系列较为有效的算法,这些算法极大的提升了故障诊断的效率和精度。然而,在滚动轴承故障诊断的相关算法领
学位
lncRNA是由200多个核苷酸组成的RNA并且无法翻译成蛋白质。大量证据表明,lncRNA在细胞的整个生命周期中发挥着不可或缺的作用,如细胞周期调控、染色质修饰、遗传标记、转录、剪接、基因组重排、mRNA衰变和翻译等。位于细胞核lncRNA通过染色质调节多种基因的表达。例如,morbid是一种核定位的lncRNA。位于胞质溶胶中的lncRNA主要充当转录后调节因子。同样,lncRNA-HGBC,
学位
三维重建作为计算机视觉领域中的研究方向之一,可用于自动驾驶、虚拟现实、智慧城市等场景。三维重建研究主要分为基于体素的重建、基于网格的重建和基于点云的重建三大类。其中,点云能够直观地描绘物体的外观形态与细节特征,同时点云也包含颜色、反射强度、距离等信息。凭借点云的优点,三维点云重建吸引了大量的关注。现有的三维点云重建技术可以分为两类,分别是基于光度一致性和几何一致性的传统方法和基于深度学习的神经网络
学位
磷矿伴生稀土元素是获取稀土资源的重要途径。我国磷块岩型稀土矿分布广,稀土含量高,具有综合回收价值,是仅次于独立稀土矿床的伴生稀土资源。本文主要研究云南安宁磷矿中稀土元素分布规律和赋存状态,并比较了磷矿石中稀土元素总量与磷含量的关系,结果表明磷矿石中稀土氧化物总量为72×10-6~1 050×10-6,与磷含量呈一定的正相关关系。另外通过光学显微镜及电子显微镜观察发现,安宁磷矿中缺乏独立的稀土矿物,
期刊
报纸
糖尿病视网膜病变是成年人低视力和致盲的主要原因。一个合理的体外模型不仅能模拟疾病的发生发展机制,而且能减少经济投入,因此筛选和构建合适的体外模型是研究的关键。论文围绕糖尿病视网膜病变探讨了炎症反应、细胞凋亡、血管功能障碍和神经血管单元的破坏等相关机制,总结了内皮细胞、周细胞、视网膜色素上皮细胞、神经胶质细胞等建立的几种模型,以期为糖尿病视网膜病变机制研究及相应的药物研发提供有益的参考。
期刊
黑色素瘤是一种典型且严重的皮肤病,黑色素瘤死亡率高。当前,医学影像深度学习的快速发展推动了医学辅助诊断效率和准确性的提升。基于计算机视觉技术的自动黑色素瘤分类技术作为一种有效的早期诊断筛查工具具有广阔的前景,可以帮助医生快速筛选出可疑病变,有助于提高活检或手术的工作效率。各种新技术的发展以及数据集的增长,为近年各种分类算法的快速发展提供了支持,在多个医学任务上达到专业医生的判断水平。但医学领域的深
学位