基于时序性相似度搜索的序列推荐方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ttgxa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,信息过载问题严重困扰着每一个人。在我们的日常生活以及互联网行业中,推荐系统对于解决信息过载问题起着不可或缺的作用。在实际应用中,几乎每一条数据都带有时间标签,数据间的时间跨度是一个不可忽视的问题。因此时序性推荐系统受到广泛关注。直观地讲,数据越旧,推荐时的时间权重就越小,因此常规研究始终使用遗忘曲线来建模时间因子。但是,这些研究仅将时间作为一个公共属性,而不是维度。用户和项目之间的每次交互行为实际上在时间维度上都不是独立的,并且它们的时间先后顺序包含很多信息,利用交互行为之间的时间顺序关系和数据网络的整体结构将有效地提高推荐准确度。作为解决时间维度信息丢失问题的新兴话题,序列推荐系统近年来引起了越来越多的关注。序列推荐系统将用户-项目交互视为一个动态序列,并考虑顺序依赖关系,以捕捉用户当前和最近的偏好,从而获得更准确的推荐。然而,一些问题也困扰着序列推荐系统。首先,在序列推荐系统中,短期序列模式可以覆盖长期序列模式。其次,用户的偏好和商品的流行程度都是动态的,而不是静态的。事实上,用户的兴趣不是一成不变的。商品受季节、节日、天气等因素影响较大。这样的动态特性对于精确分析用户或项目以获得更准确的推荐具有重要意义。现有的序列推荐系统大多只能简单地捕捉短期内的动态变化。最后,与其他推荐系统一样,序列推荐系统也面临着冷启动和数据稀疏性的挑战性问题。基于跨域推荐的热门解决方案旨在通过将显式或隐式反馈从辅助域迁移到目标域来填补矩阵。遗憾的是,大多数现有的迁移算法无法处理时间信息。在本文中,我们结合相似度搜索,构建新的序列推荐模型,解决长短期序列模式的干扰问题和用户偏好及商品流行度动态变化的问题。然后,利用序列填充算法构建跨域序列推荐系统。本文的具体工作和贡献概括如下:1.基于序列相似度搜索的时序推荐本文提出了一个名为SeqSim的推荐框架,它可以解决推荐系统的时序性问题和偏好演化问题。在SeqSim框架中,我们重新对用户或项目进行建模,利用序列来对其进行表达。基于此,用户或项目间的相似度计算被转化为了序列间的相似度计算。为了测量序列相似度,本文提出了一种新的序列相似度算法。同时,为了提高相似度搜索的效率,一种新的时间聚类算法被提出,将项目序列转换为聚类序列。并提出了一种结合偏好曲线的新算法来进行推荐。我们在MovieLens和Amazon的数据集上系统地比较了 SeqSim算法与其他主流算法。结果证实SeqSim算法大大提高了推荐的准确性。2.基于序列填充的跨域序列推荐系统为了解决冷启动和数据稀疏性的挑战,本文定义了序列填充的概念,并提出了一种序列填充算法。其中我们使用用户和项目之间的评分矩阵、内在特征以及用户行为的时间标签来建立序列填充的相似度度量。然后将此算法应用到了三种序列推荐模型中,并通过实验验证该算法的有效性。首先,直接使用长短期记忆网络(LSTM);其次,将序列填充算法深度整合到长短期记忆网络中,通过在下一个时间步的输出层和输入层之间建立连接来改进长短期记忆网络(LSTM),并在连接中加入一个逻辑单元来完成序列填充;最后,使用上文构建的SeqSim模型。我们在Amazon数据集上进行了大量实验,实验结果显示,我们的三种模型在推荐性能上均要优于目前的主流模型。此外,我们结合不同评价标准下的实验结果,更细粒度地分析了三种模型的优劣。
其他文献
在无线传感器网络的研究中,分簇路由协议是其中的重要分支,2000年提出的LEACH协议成为了众多研究的基础。其中非均匀分簇路由协议作为解决能量空洞问题的重要手段,能够极大的延长网络的生命周期,有着广阔的应用前景。本文基于传统非均匀分簇EEUC协议,在簇头选举,数据融合,路由传输三个阶段分别提出相应的优化方法,用来降低网络能耗延长网络生命周期以及提高传输数据的精度,论文主要工作如下:(1)在簇头选举
随着光学技术及产品的开发和应用,金属镜作为其中重要的光学元件之一,对金属镜实现高效、高精、低表面损伤加工的需求越来越多,对加工技术的要求越来越高。本文针对固结磨料磨具研磨金属镜加工技术进行了深入的研究。本文对固结磨料磨具研磨的加工机理进行分析,从磨粒角度入手,分析了单颗磨粒的受力和磨粒整体分布情况;对不定偏心研磨下,固结磨料磨具与工件间的相对运动轨迹进行探索,推导出了磨具上一点相对于工件的轨迹方程
网络考试系统是高校考试方式的发展趋势,尤其今年疫情带来的影响,更加迫切的需要考试的网络化。本论文探索实现的是支持大规模考生参加的局域网网络考试系统。本论文主要通过对现有考试方式的分析,确立了系统开发的可行性、必要性,完成了系统的功能性需求、非功能性需求。之后对网络考试系统进行了概要设计,介绍了微服务架构与单体应用架构之间的对比,阐释了本文采用微服务架构的优点,设计了考务管理前端、考试终端,进行了微
国际能源危机的来临、国家政策的导向促使节能问题成为制造业关注的重点问题。随着智能工厂的发展,机器人柔性生产线将会在未来逐渐成为制造工厂中的生产主力军,同时也是制造工厂的主要能耗者。可以预见,机器人柔性生产线节能技术具有重要的研究意义。本文基于工业机器人轨迹规划和柔性生产线调度,开展机器人柔性生产线节能技术研究。所提出的节能技术均在真实工业机器人与柔性生产线进行了应用实验,具有一定的应用价值。主要研
随着互联网技术的快速发展,安全技术与云计算逐渐交织形成一种新的安全防御途径——安全共享资源池。“安全即服务”作为一种新的服务受到学术界和产业界极大的关注,用户只需租用安全资源,即可在不消耗本地计算资源的情况下享受到安全服务。但是随着安全共享资源池的扩展,数据中心管理成本不断增加,安全资源池如何在确保安全性的同时降低成本成为人们关注的问题。研究根据节点资源负载随时间的变化特点,达到安全共享资源池的资
连接查询技术往往需要很高的时间开销。随着数据量加大,连接查询会因其时间开销过大而失去实用性。现实的数据集通常是包含大量重复元组的脏数据集,会造成查询结果包含重复元
随着大数据时代的到来,互联网迎来新的发展,无论对于企业还是个人,数据信息都越来越重要,保护数据信息的安全,在发生意外的时候保证充足的容灾备份成为当下越来越重要的研究方向。由于数据量的飞速增长,需要通过迅速、高效的方法把源数据同步到备份服务器中。采用常规同步的方法在面对数据量较大的时候,有占用存储空间多,占用网络带宽高,同步效率低下等问题,所以本文从现实考虑出发,提出以数据分块算法和布隆过滤器为基础
近年来,国家多次进行普法行动意图让全国人民知法懂法,以此来降低犯罪率。全靠人力来普法将是一个漫长而艰难的过程,目前很多涉案人员了解案情都是要通过求助专业法律人员,这
人类获取信息的80%以上来自视觉,大脑视觉系统具有效率高和鲁棒性强等优势,如何理解和模拟大脑视觉信息加工方式是神经科学与计算机科学交叉领域的热点问题。功能磁共振成像(functional Magnetic Resonance Imaging,f MRI)因其良好的时空间分辨率和无损成像等优点已成为研究人脑的主要手段之一。基于f MRI建立视觉编码模型是以大脑视觉感知机制为依据,模拟大脑视觉信息处理
用户识别问题是数据分析和挖掘中的重要问题之一,旨在实现对关联到某些资源信息的人的身份进行验证。通常情况下,研究人员利用与用户相关的数据资源,提取可以作为用户身份标识的特征,通过特征降维、选择等操作后,使用相似性度量方法对用户的特征进行相似度匹配,输出相似度最大的结果作为识别结果。用户识别问题在个性化推荐、信息取证和隐私保护等领域具有广泛的应用和重要的研究价值。在用户识别问题研究中,特征的选择和构造