【摘 要】
:
随着互联网电商平台的兴起,商品推荐系统发展迅速。研究表明,基于用户与商品交互序列的推荐算法能够感知用户的长期偏好,有助于提升推荐效果。通过对真实数据集分析,发现某些情况下交易数据具有稀疏和短交互性的特征,在二手交易平台中尤为明显,此类问题降低了序列建模推荐方法的有效性。与此同时,当推荐系统进一步面对用户冷启动问题时,有必要综合考虑算法的适应性和数据的稀疏性问题。基于上述分析,对面向稀疏数据的序列建
论文部分内容阅读
随着互联网电商平台的兴起,商品推荐系统发展迅速。研究表明,基于用户与商品交互序列的推荐算法能够感知用户的长期偏好,有助于提升推荐效果。通过对真实数据集分析,发现某些情况下交易数据具有稀疏和短交互性的特征,在二手交易平台中尤为明显,此类问题降低了序列建模推荐方法的有效性。与此同时,当推荐系统进一步面对用户冷启动问题时,有必要综合考虑算法的适应性和数据的稀疏性问题。基于上述分析,对面向稀疏数据的序列建模和用户短交互冷启动问题开展相关研究,从而更好的满足稀疏冷启动环境下对于推荐算法的实际应用需求。主要工作包括建立了适用于稀疏短交互数据的马尔科夫链序列推荐模型,实现了用户冷启动现象的元学习优化算法。在序列推荐建模方面,先对序列交互数据预处理,通过已有长序列生成更多短序列,丰富偏好特征训练样本,使用基于时间流行度的采样方法精选短序列样本;结合知识图谱链路预测的方法提取用户的偏好特征;将用户偏好特征和商品特征映射至同一向量空间,增强序列推荐的预测准确性;使用马尔科夫链概率公式预测下一项商品。针对用户冷启动问题,将提出的序列建模方法与基于参数优化的元学习方法相结合,采用双层梯度下降的模型优化策略,在适应数据稀疏性的前提下优化模型参数,使得模型在冷启动场景下拥有更好的表现。在二手电商Mercari和传统电商Amazon两个数据集上开展一系列实验,两数据集均具有稀疏短交互的特征,其中Mercari数据集比Amazon数据集拥有更大的稀疏度和更短的平均交互长度。与现有方法的对比实验表明,本方法相对主流算法取得了较好的结果,相对于其中的Meta CF算法在下一项商品预测准确率分别提升了0.024和0.015,且本方法在Mercari数据集上具备更明显的提升效果。此外对模型进行消融实验,结果表明采样方法与知识图谱关系提取技术能提升稀疏短交互数据下的序列推荐性能,同时元学习优化算法能够使模型很好地适应冷启动场景。
其他文献
如何从海量的互联网数据中提取出实体关系是信息抽取亟待解决的问题之一。关系抽取包括句内关系抽取和文档级别关系抽取。在文档级别的关系抽取任务中,输入文本序列长且由多句话组成,同时实体往往位于不同句子中,因此需要多句子共同推理才能得出实体对之间的关系。相比句内关系抽取,文档级别关系抽取面临诸多挑战,如文本特征提取不充分、跨句推理能力不足等。对此,研发了融合多维度与上下文特征的关系抽取系统。在该系统中,针
中国式农村教育现代化发展道路需要有自身的理论建构。中西比较维度下对西方农村教育现代化道路与理论的批判与超越成为建构中国化理论的起点,这一维度要求中国式农村教育现代化理论要打破西方意识形态偏见,探索不同于西方的本土现代化模式;以世界先进水平为标准定位教育现代化,积极推进教育强国建设;破除路径唯一性幻象,探索传统与现代共存、乡土化与城市化并进的新型农村教育现代化之路。历史变迁维度下对中国式农村教育现代
冠心病是最常见的心血管疾病,给居民带来严重的健康问题和经济负担。冠状动脉分段标记可用于冠心病的病理分析,对冠状动脉血管造影图像中不同类别的血管段应用不同权重,计算解剖结构分支的统计数据。冠状动脉分段标记得越精确和细致,越有助于自动量化冠心病的复杂程度,加快医生分析工作的流程时间。目前,大多数基于深度学习的分段标记方法能够自动对冠状动脉完成分段,但是存在分段类别过少的问题,无法识别不常见的分支。冠状
联邦学习允许参与者在不共享数据的前提下协同训练模型,由于其很好地保护了用户数据隐私并打破数据孤岛,逐渐成为了国内外研究人员的关注热点。联邦集成蒸馏(Federated Distillation and Fusion,Fed DF)算法是联邦学习中一种现有的高效中心聚合算法,该算法以外源数据为蒸馏数据,对初步参数平均聚合得到的模型再蒸馏来提高模型的预测准确度。但在实际场景中外源数据难以获取,且在训练
新型冠状病毒肺炎是一种严重危害世界人民健康甚至生命的疾病。对新冠的研究有多个方面,其中,患者在治疗过程中病情变化规律的研究,是一个重要的问题。根据患者治疗中的指标表现,可将其分为普通、重症、死亡3种程度,病情的变化规律指的是患病程度如何变化。根据临床实际治疗样本,总结了四种新冠患者病情变化规律:普通仍然普通、普通变成重症、重症变成普通、重症变成死亡。现阶段统计了上述四类患者的临床数据,包括病人肺部
随着我国医疗科技的飞速发展,人们对医疗服务的需求和依赖也呈爆炸式增长,在这个过程中,不可避免地滋生出了许多治疗不规范、费用不合理的情况。为了能够提高医疗质量、控制医疗费用,临床路径与疾病诊断相关分组(Diagnosis Related Groups,DRG)作为一种有效的技术手段开始被广泛使用。但是其依然存在着数据容易被篡改、医疗异常无法及时被发现以及出现医疗事故后无法查询出详细信息和定责等问题。
近年来,社群搜索已经广泛用于好友推荐、事件组织与活动举办和基于地理与社交的数据分析等基于位置的应用场景中,但是社群中包含大量的用户信息,如果对社群搜索进行不当的利用,用户的社交好友关系、签到行为喜好甚至其他隐私信息都会被泄露,采取措施保护用户的原始数据,消除社群搜索应用存在的隐私泄露隐患,对保证用户的安全具有重要意义。分析了仅对用户的社交关系或签到数据采取隐私保护后,社群搜索仍然存在的隐私泄露问题
为了准确刻画网络论坛投资者情绪并探讨其与我国股市的收益关系,本文将根据东方财富网股吧数据,基于BERT模型构建投资者情绪指数,并借助向量自回归模型考察投资者情绪与股市收益率和成交量之间的动态影响。实证结果表明:相较于6种经典的情感分类模型,本文构建的BERT模型在各项评估指标上的表现更佳;股市收益率对投资者情绪存在正向影响,投资者情绪与成交量存在双向影响。
在计算机视觉领域,三维人脸重建是一个非常热门的研究方向。三维人脸重建方法的目标是根据已有的二维人脸图像,构建出真实且高精度的三维人脸。由三维人脸重建算法恢复的三维人脸可以应用于影视、动画和医学等领域。三维人脸重建技术可作为辅助技术用于人脸编辑和人脸识别等研究方向。现有的基于深度学习的三维人脸重建方法无法生成真实的人脸纹理和精确的人脸形状,对于多样性原始图像重建人脸的鲁棒性不够好。为了生成更加真实且
随着深度学习技术的不断发展及相关产业需求的提升,基于图像的三维物体重建技术受到越来越多的关注。目前,主流三维重建多以深度神经网络为技术支撑,通常包含编码器和解码器两个核心模块。然而,由于深度学习技术在三维重建方面的研究起步较晚,重建出的三维物体在局部细节上仍有待完善。鉴于此,以高质量三维重建为核心需求,围绕深度神经网络中的编码器和解码器设计,开展了以下研究:首先,设计了基于多分辨率编码的三维点云重