【摘 要】
:
在信息过载的当前互联网环境下,用户获取有价值信息的信息成本越来越高,为了解决这一问题,推荐系统(Recommendation System,RS)应运而生。推荐系统从用户项目交互信息或静态特征中推断用户偏好,并进一步推荐用户可能感兴趣的项目,以帮助用户做出更有效的决策,有很大的应用价值。而在某些场景中,用户信息是匿名的,推荐系统只能根据用户点击行为序列来学习用户的兴趣表示,该类情况被归为推荐系统的
论文部分内容阅读
在信息过载的当前互联网环境下,用户获取有价值信息的信息成本越来越高,为了解决这一问题,推荐系统(Recommendation System,RS)应运而生。推荐系统从用户项目交互信息或静态特征中推断用户偏好,并进一步推荐用户可能感兴趣的项目,以帮助用户做出更有效的决策,有很大的应用价值。而在某些场景中,用户信息是匿名的,推荐系统只能根据用户点击行为序列来学习用户的兴趣表示,该类情况被归为推荐系统的一个子类型,即基于会话的推荐(Session-based Recommendation,SBR),它认为用户的偏好是随着时间不断改变的,通过用户实时交互会话序列来预测推荐列表。近年来,由于会话推荐系统具有较高的实际应用价值,受到了学术界和工业界的关注,并提出了许多有效的解决方案,但现有的方法也存在着许多问题。现有方法存在匿名情况下冷启动与数据稀疏的问题,在用户匿名的情况下,关于用户的偏好信息只有当前点击行为序列;现有方法存在流行度偏差导致的长尾效应问题,不受欢迎的项目难于被推荐;基于图神经网络的方法存在生成会话序列表示时的信息丢失问题和无效的远程依赖关系捕获问题,由于从会话序列到向量表示的有损编码,一些有关项目转换关系的序列信息被忽略,由于迭代的层数有限,图神经网络无法捕获会话中的某些远程依赖项信息。为了解决上述问题,本文的主要工作如下:(一)提出一种基于注意力门控图神经网络的会话推荐模型。该模型通过门控图神经网络捕获用户点击行为序列中复杂的项目转换关系,获取序列的局部依赖,缓解信息丢失与数据稀疏的问题,并在模型输入前,模型训练中,模型输出后分别正则化项目嵌入和会话表示,缓解长尾中的项目难以推荐问题,最后,利用注意力机制为用户互动的项目分配注意力权重,捕获会话中远程项目对推荐结果的影响,从会话中获取用户的动态兴趣表示,构建融合上下文信息的基于门控图神经网络和注意力机制的会话推荐模型。(二)通过实验来验证本文模型的有效性。本文在两个公开的电商数据集上进行实验验证,通过与基线模型的对比试验,验证了该模型有效的提高了推荐性能,通过消融实验证明了模型中注意力模块的有效性,通过不同会话长度对模型性能影响实验验证了模型捕获长期兴趣的必要性。(三)设计并实现了基于本文提出模型的会话型商品推荐系统。在A-GGNN模型的基础上,本文使用Python语言和Django框架设计并实现了会话型商品推荐系统,使用的数据库为My SQL和Redis数据库,该系统根据用户在连续时间段内的点击行为序列,为用户提供个性化的商品推荐功能。
其他文献
共享这类现阶段较为普遍的消费模式,很早就出现在人们生活中,它被理解为按需相互输出但不过度追求输入的一类商品,通常发生在较为亲密的社会关系间。过去十年,社会经济不断发展、大众对于商品的期望值变高、商品归属权认知的变化等推动了共享经济行业的飞速发展,而其首要实践领域则为旅游及住宿行业,共享经济与其彼此融合,便成就了共享住宿。共享住宿平台Airbnb现已成为极受欢迎的住宿选择,预计会对酒店行业造成一定冲
近年来,随着深度学习的飞速发展,视觉问答领域已经取得了重大进步。视觉问答作为计算机视觉与自然语言处理的交叉领域,其基本任务是观察图像并在此基础上回答文本问题。现有的方法大多是通过预训练的自上而下的注意力机制对图像特征进行表示,然后使用单层门控循环单元(GRU)对文本问题进行编码,最后联合这两种特征得到预测答案。目前,虽然视觉问答系统在准确率上体现出了强大的性能,但无法提供模型决策的过程以及理由,这
数据市场是目前研究的热点话题,在提出数据要素化的政策之后,国内各类数据交易平台迅速发展起来,针对数据市场的研究也越来越多。在2021年,北京成立了国际大数据交易所,同年,上海大数据交易所也宣布成立,这更加激发了对数据交易市场的研究热潮,同时也标志着我国数据要素市场的正处于蓬勃发展阶段。在数据交易市场的相关领域中,对数据定价体系的研究更是重中之重。现有的研究大多是从传统商品的定价方案进行迁移,但是数
在计算机相关技术飞速发展的时代下,计算机技术辅助教学成为热门趋势。在老师的教学和学生的学习过程中,收集习题都是一个必可不可少的工作。然而,手工摘抄习题非常费时费力。利用计算机视觉技术,对拍照获得的习题图像进行文本检测和识别,使得将纸质习题自动变成电子文档成为一种可能。另一方面,文本检测和识别技术一直以来都是计算机视觉研究的热点问题。现有的研究主要面向自然场景和印刷体识别,鲜有针对习题检测和识别的研
研究目的和内容:9号染色体长臂的C-ABL基因移位至22号染色体上长臂断裂点集中区基因(BCR)产生致癌的BCR-ABL融合基因,有95%的慢性粒细胞性白血病(Chronic Myelogenous Leukemia,CML)患者被检测有此染色体易位,该融合基因编码的BCR-ABL融合蛋白(BCR-ABL fusion protein)具有很强的酪氨酸蛋白激酶活性,是CML发病的分子生物学基础。基
电商异常订单检测是近年来异常检测在电商供应链领域中最为热门的任务之一。早期的异常订单检测任务通常是采用个别算法构筑模型,并利用调参手段尽力逼近模型精度上限。但在实际情况中,异常订单的起因多种多样,尽管统一被标注为异常订单,但其样本特征与标签间的映射关联不同,也就是说,基于单一假设的单模型仅擅长识别符合假设的异常订单,而对背离假设的异常订单识别能力有所欠缺,造成单模型难以胜任检测任务。随着组织和个人
据国家统计信息中心统计,2021年1月至10期间,全国总诊疗人次达到54.4亿人次,同比增长23.4%,医疗服务体量巨大。然而,我国人口基数大,人均医疗资源相对较少,且部分地区医疗资源仍存在短缺情况。在保证完成大体量医疗服务的同时,借助用药辅助系统提高医疗服务质量与服务效率是缓解医疗资源短缺的有效方法之一。用药辅助系统可以为医生用药提供辅助决策信息,在医疗资源短缺、医疗服务需求量大的情况下,不仅可
我国拥有十几亿人口,土地面积居世界第三,人口密度较高。特别是一线城市,存在着诸多公共场合,如机场、火车站、影剧院、球场等,不仅人口聚积密度高,而且形成了人流极大的场景。在这类场景下,由于人们素质参差不齐、心中目的目标各异,各种摩擦、冲突时有发生,既增加了突发事件出现的概率,给公共管理带来了巨大挑战,也极大地提高了管理的难度和成本。针对对突发公共安全事件频发态势,国家出台了相对严柯的管控措施,但收效
股价预测在金融市场研究中有着非常重要的意义,想要准确预测股价的变化是非常困难的。随着经济和科技的发展,金融市场也变得更为复杂,每天生产着数以亿计的交易信息,由此而产生了大量的低价值数据,由于这些数据具有高噪声、非线性、波动性强等特点,所以这些数据已不适合通过传统计量模型来处理。根据行为金融学理论,股票的内在价值只是决定股票价格的因素之一,投资者的行为也深刻影响着股票价格。投资者在投资决策中容易受到
数据规模在持续爆炸式不断扩大。IDC(International Data Corporation)对全球数据规模进行的预测显示,截止到2025年,全球数据量可达175ZB。社会各界、各方团体对于数据的使用和认知不断加深,人们愈发重视数据本身的经济学特征。中国是数据大国,随着数据要素化政策的出台,各地数据交易机构建立并试运行,国内数据市场初具规模,其健康发展需要坚实的理论研究作为支撑。但是数据资产