【摘 要】
:
近年来,随着移动设备和互联网业务的快速发展,推荐系统在解决信息超载问题、满足用户多样化需求方面发挥着越来越重要的作用。同时,一些大型电子商务平台以极高的速度产生大量的交互数据。一方面,这类交互数据很好地反映了用户的偏好和行为模式,对于提升用户体验和提高企业利润具有积极地作用;另一方面,这类数据具有连续、高速、随时间变化的特点,并且以数据流的形式呈现,和传统离线环境下的静态数据有很大的不同,这为流环
论文部分内容阅读
近年来,随着移动设备和互联网业务的快速发展,推荐系统在解决信息超载问题、满足用户多样化需求方面发挥着越来越重要的作用。同时,一些大型电子商务平台以极高的速度产生大量的交互数据。一方面,这类交互数据很好地反映了用户的偏好和行为模式,对于提升用户体验和提高企业利润具有积极地作用;另一方面,这类数据具有连续、高速、随时间变化的特点,并且以数据流的形式呈现,和传统离线环境下的静态数据有很大的不同,这为流环境下的推荐系统提供了前所未有的机遇。基于以上情况,本文研究了流环境下的序列推荐技术,希望能借助实时数据,对用户偏好做出精准预测。尽管许多方法在推荐系统上已经取得了很好的效果,但目前的工作大多是基于离线环境的,无法及时捕捉信息的变化情况。一些近期研究工作尝试使用在线策略来对推荐系统进行改进,但这些模型通常采用最新数据来更新模型,这在一定程度上会造成用户长期偏好的缺失,影响推荐效果。此外,现有的流环境下推荐方法主要针对通用推荐,缺少对序列推荐等场景特点的考虑,影响推荐精度,难以满足多样场景中的推荐需求。对此,本文研究了流环境下的序列推荐问题,并重点从数据采样和模型更新两个角度来对其进行优化。具体来说,本文首先提出了基于蓄水池的主动采样策略来解决流环境下数据量过大的问题,主动选择历史数据中最有信息量的序列信息;然后,针对模型优化过程中负样本信息量不足导致模型收敛较慢的问题,提出了基于对抗生成网络的负采样策略,并利用Gumble-Sotfmax算法解决离散数据下存在的梯度阻塞问题,有效提高了模型优化速度;此外,针对现实生活中面临的POI序列推荐问题,利用元学习策略来保持用户的历史偏好,并且设计了一个转移网络对参数进行动态更新,实现从模型角度对用户偏好和兴趣漂移的捕捉。针对通用流环境下的序列推荐,本文在MovieLens和Amazon-CDs数据集上验证了基于蓄水池主动采样和基于对抗生成网络的负采样策略的有效性;针对POI序列推荐,本文在常用的Foursquare和Yelp数据集上进行了验证。相关实验都和目前最先进的推荐模型进行了比较,结果表明,本文提出的流环境下的序列推荐模型在各方面均优于之前的推荐模型,对现实场景的应用具有一定的参考价值。
其他文献
随着金融交易市场的迅速发展,互联网金融和移动金融逐渐成为投资交易的新型金融业务模式,这给投资者带来了极大便利的同时,也使得金融市场的交易数据呈爆炸式增长。在金融资产的交易过程中,订单流的限价指令信息形成了限价指令簿。投资者能够利用限价指令簿来预测金融资产的价格趋势,并根据预测的结果进行交易决策。目前,限价指令簿趋势预测的主流方法是深度学习方法,其中大部分方法只采用限价指令簿的事实信息,少量方法会兼
场景图生成任务是对图像理解的一种结构化表示形式,这种表示形式不仅可以为基本的目标识别任务提供上下文线索,还可以为更广泛的高级视觉任务提供价值,应用前景十分广泛。针对模型中的单峰偏置问题和数据集中的数据偏置问题,论文首先研究模型单峰偏置缓解,通过引入协同策略来缓解单峰偏置,并基于提出的场景图生成模型展开数据偏置缓解的研究,重点研究了奖惩策略下和类平衡策略下的场景图生成方法。主要工作内容如下:(1)针
捆绑销售旨在向用户推荐捆绑的商品包,具有着重要的营销价值。互联网技术的浪潮推动了对捆绑销售场景的研究,根据不同的捆绑销售场景,将推荐任务划分为商品包推荐、合购者推荐和多任务推荐,并在图神经网络的框架下,推进对这三个推荐任务的研究。主要内容有:(1)针对向用户推荐捆绑商品包的问题,本文提出了模型IHBR。模型根据用户的对捆绑商品的购买意图探究了商品之间的共购、共现关系,使用自注意机制学习商品依赖性,
随着智能移动设备的发展和普及,各种基于位置的服务提供商不断涌现,为用户提供丰富多彩的服务,比如查找最近的餐馆、规划出行路线等。路网最短路径及其距离查询作为各种服务最核心、最高频的操作,它的计算效率极大地影响着服务质量和用户体验。现有的最短路径及其距离查询算法,没有充分挖掘、利用查询和路径的时空信息,算法计算效率不能满足实际应用需求。本文在分析现有工作不足的基础上,深入研究路网最短路径及其距离查询算
抽象语义表示(Abstract Meaning Representation,AMR)是一种新型的句子级语义表示方法,它将句子的语义表示为一个单根有向无环图。AMR文本生成(AMR-to-text Generation)任务的目标是获取与给定AMR图具有同样语义的句子。随着神经网络在自然语言生成领域中的兴起,序列到序列模型在AMR文本生成任务中也取得了很好的性能。本文围绕基于序列到序列Transf
缺陷检测是工业生产过程中把控出厂产品质量的关键步骤,实现自动化缺陷检测对促进“智”造业发展有着重要意义。近年来,深度学习算法被广泛应用于缺陷检测领域并取得了不错的检测效果,但现有的相关研究大多仅针对某特定的检测场景,且对运行检测程序的设备性能要求较高,不具备良好的可迁移性和推广价值。文中通过总结缺陷检测应用场景的共性,使用基于神经网络的机器视觉方法设计并实现了一个可迁移、高适配的缺陷检测应用框架,
自动文本摘要技术一直是自然语言处理中的热点与难点。近年来,针对新闻文本的摘要生成研究较多,且已日趋成熟。相比于具有较固定结构的新闻文本,还有一些长文本具有复杂的文本结构,如专利、剧本等。由于这些文本的摘要研究不多,使用传统文本摘要方法生成的摘要存在着内容不准确、覆盖不全面等问题。以往的大量研究主要集中在对语义信息等序列化信息的使用上,而相关研究表明文本结构信息对于摘要的生成同样具有较大的作用。本文
近年来,深度学习在各个领域获得突破性进展,而通过深度学习对机器翻译任务建模的神经机器翻译方法成为诸多学者研究的对象,并且在性能上逐渐超越统计机器翻译,成为机器翻译研究和实际应用的主流范式。但是,神经机器翻译的性能极大程度地依赖双语平行数据的规模和质量,这导致神经机器翻译在诸多低资源语言的翻译任务中无法获得良好的性能。在实际的训练过程中,最明显的问题就是因为训练数据不足导致的过拟合和泛化能力不足,并
随着社交网络的流行,人们通常会在多个社交平台上注册账号以满足不同的社会需求。跨多社交平台用户连接旨在将多个社交平台上属于同一自然人的不同账号连接起来以聚合分散的用户信息,这对跨域商业推荐、网络安全、身份验证等诸多应用都具有重要的意义。然而大多数现有研究关注的是两个社交平台之间的用户连接,且该类方法通过“链式规则”应用于三个及以上平台时通常具有较低的召回率和精确率。因此,本文主要研究跨三个及以上社交
随着全球定位系统技术、移动设备和互联网的普及与飞速发展,基于位置信息的社交媒体逐渐成为人们日常出行、社交的必备工具。用户会在社交平台上留下足迹,而平台会根据用户签到历史记录,推荐用户可能访问的兴趣点。这可以提高用户体验与平台粘性。因此下一个兴趣点推荐得到广泛的应用和研究。现有的下一个兴趣点推荐方法仍存在着数据稀疏、上下文语义不足等问题,这些问题会降低模型效果。本文使用了多视角建模的方式,从不同视角