基于双曲空间的序列推荐方法与基准测试研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lxm1230520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统在人们的生产生活中应用广泛,在信息爆炸时代对于信息的过滤、便民服务等方面发挥了重要作用。序列推荐是推荐系统的重要领域,被广泛应用于电影、电商、短视频等行业,其主要任务是通过分析用户与项目之间的交互序列,利用序列之间的依赖性来捕获用户最近期的偏好,从而预测用户下一次可能交互的项目。推荐系统成功的关键是用户偏好和项目特征的准确表示,许多广泛应用的推荐模型都是基于欧几里得空间(即欧氏空间)的表示学习,即使用内积或欧氏距离来计算用户表示和推荐项目表示之间的相似性。随着大数据时代高维数据的爆炸性增长,推荐系统中的推荐项目信息通常带有层次结构的特征信息,如服装商品中分为上衣等类别,上衣中又包含卫衣。传统基于欧几里得空间的推荐模型,在嵌入无标度和分层结构数据表示时会产生较大的失真现象,从而影响推荐的效果。为了减少失真,有必要增加计算空间的规模,但是随着空间规模的扩大,推荐算法所需的计算资源也随之增加。针对序列推荐方法中暴露出的大数据推荐效果失真等问题,文章采用双曲空间对传统序列推荐算法进行优化,设计新的序列推荐模型,给出系列基准测试。双曲空间是曲率为负常数的一种非欧几里得空间,可以看作是树的连续形式,本质上更适合建模层次结构。针对欧几里得空间无法捕获数据中的层次结构等问题,论文提出了一种基于双曲空间的序列推荐算法,该方法融合因子分解机和深度神经网络,在捕获低阶特征和高阶特征的同时加入平移空间来增强表示能力;将表示模型嵌入双曲空间捕获数据中的层次结构信息,提高推荐的效果。针对双曲空间和双曲嵌入虽然在推荐系统中得到了广泛关注,但是没有一个具体的基准测试问题,论文给出了基于双曲空间的推荐算法性能分析,提供了在推荐系统中何时使用双曲空间和双曲嵌入的理论分析和实证结果。为了检验基于双曲空间的序列推荐模型的效果,论文在MovieLens等3个真实世界公开数据集上进行了大量的实验,结果表明与其他方法相比该方法具有更优的表现,验证了基于双曲空间的序列推荐的合理性和有效性。为了对基于双曲空间的推荐算法进行全面的性能分析,本文选取了 5个不同推荐领域常用的模型,在Epinions等6个真实世界公开数据集上进行了实验,通过比较在不同情况下,各个模型在欧几里得空间和双曲空间的性能,最终得出结论:(1)距离模型比投影模型更适合学习双曲嵌入;(2)当数据集的密度比较小时,双曲空间比欧几里得空间更强大;(3)当潜在空间维度较小时,模型在双曲空间的性能优于欧几里得空间。
其他文献
行政事业单位组织、管理并指挥着国家的各项行政事务,行使政府赋予的各项权力和职能,行政事业单位的服务水平是一个国家政府服务能力的集中体现。经济发展在任何时期都处于最重要的地位,近年来,比起经济发展的速度我们更加注重发展的质量,受疫情等因素的影响,基层各地经济的稳定性受到着威胁,除最直接的主体企业之外,行政事业单位的作用也不容忽视,并且越发重要。在当前的时代背景下,行政事业单位在迎接疫情带来的巨大挑战
学位
随着计算机视觉基础研究的不断发展,目标检测任务一直都是一个热点方向,在机器人设备、工业零件异常检测、监控设备异常人物检测等诸多领域充当辅助任务或主要任务,具有重要的现实意义。计算机视觉任务十分多样化,除了通用目标检测任务外,它还有一些其他的分支,比如人脸检测、行人检测、行人重识别等。由于目标检测在科研和工业中重要的地位,使其成为了近年来的研究热点。深度学习技术的发展速度越来越快,目标检测算法也随之
学位
利用Gleeble-3500热模拟试验机对18CrNiMo7-6齿轮钢进行了等温单道次压缩试验,研究了变形温度为900~1150℃,应变速率为0.01~5 s-1,应变为0.76的条件下材料的热变形行为;并且通过光学显微镜对热变形后的微观组织进行了分析。建立了唯象型Arrhenius本构方程,预测的峰值应力与试验数据具有很好的一致性。高温热变形过程是加工硬化与动态回复以及动态再结晶的竞争过程,在热
期刊
随着基于物理的三维场景渲染技术在影音娱乐、工业设计等行业领域的大范围应用,业界对渲染真实感的要求也越来越高。渲染结果的质量与物体表面纹理材质的表现力密切相关,获取可以精确模拟具有复杂结构的物体表面的材质资源是提高渲染质量的关键。在基于物理的渲染中,我们采用微表面模型将物体表面建模为若干个微观镜面的集合来模拟不同的材质外观,使用法线贴图保存微表面上每个点的法线方向。高质量材质的采集、表示和制作一直是
学位
近年来,基于深度学习模型在电子医疗健康记录(Electronic Health Records,EHR)中进行生存预测的研究成为热点。由于EHR的时间序列特性,很多研究都使用传统的循环神经网络进行模型构建,注意力机制也经常用在研究中,该研究可以帮助医疗从业人员更好地对患者进行临床决策。然而,目前在基于深度学习技术的生存预测任务中,现有的研究面临一些挑战:(1)在实际的医疗数据集中,经常出现很多缺失
学位
随着中国金融市场不断走向成熟,投资者面临前所未有的发展机遇。同时市场中的风险也在加剧,风险控制逐渐成为了一项极其严峻的现实问题。面对海量的、不断增长的金融数据,如何快速准确地识别股票中的风险,尽早地发现和识别股票行情中的异常状况有助于提前规避风险,减少经济损失,是股票投资中的一个充满挑战性的问题。行为金融学相关研究指出,中国A股市场中个人投资者占比较高,多元化的投资理念增加了股价的波动性,非理性泡
学位
近年来,基于移动互联网的不断发展,人类的信息表达方式逐渐增多,静态的彩色图像已经不能满足人们的日常信息交流,随着抖音、快手和西瓜视频等社交软件的兴起,短视频已经成为移动互联网时代新的主流的信息传播方式。同时视频也广泛应用于军事、经济、科技和教育等众多领域,这些都导致视频的数据量呈现爆炸式的增长,每天人们都会产生数亿条短视频,人们对视频的操作需求也变得越来越高,这给研究人员提出了较大的挑战。视频目标
学位
大学语文课程作为一门基础课、通识课,在课程思政建设中具有独特优势。在大学语文中有机融入思政教育元素,改革创新课程教学,找准课程思政内容的融入点,让学生在润物无声中树立坚定的理想信念、提高人文素养。
会议
由于天气和人为等因素的影响,雾霾现象变得更普遍并严重影响着人们的生活。雾霾天气会使图像采集设备获取的图像质量下降,从而影响无人驾驶等视觉计算系统的安全性和准确性。不同浓度的雾霾给图像上的目标检测和图像分割等深度学习领域的计算机视觉任务带来不同程度的困难,因此通过训练使深度学习模型能够学习到图像中不同程度的雾霾特征显得尤为重要。现阶段的雾霾分类方式包括两类。一类方法是基于传统数值统计的雾霾分类,此类
学位
基于消费级深度相机的实时三维重建技术包括深度相机逐帧捕捉数据、相机姿态实时估计、融合体模型提取面模型、前景分割等步骤,在重建过程中,往往会出现噪声、冗余和帧间不匹配等问题。论文详细描述了从深度相机捕捉数据到最终三维模型的建立过程中,对重建三维模型精度与质量进行提升的三种方式,分别是帧块的自适应处理,TSDF的精细化处理以及基于平面检测的前景分割。在深度相机的拍摄过程中,由于相机剧烈抖动或光线变化等
学位