【摘 要】
:
推荐系统是一种在当前互联网信息产业中应用较为广泛的系统。面对多种多样的推荐系统应用场景,数据特征和启动状态,协同过滤推荐算法面临一系列严峻的问题,这些问题包含但不仅限于冷启动问题、用户/物品矩阵稀疏和维度爆炸问题、用户-物品组织的长尾分布问题、用户选择的相似度度量问题等。本文针对当前协同过滤推荐算法存在的问题,通过引入混合相似度度量方法、结合专注力编码机制对用户行为数据编码等方法,一定程度上缓解了
论文部分内容阅读
推荐系统是一种在当前互联网信息产业中应用较为广泛的系统。面对多种多样的推荐系统应用场景,数据特征和启动状态,协同过滤推荐算法面临一系列严峻的问题,这些问题包含但不仅限于冷启动问题、用户/物品矩阵稀疏和维度爆炸问题、用户-物品组织的长尾分布问题、用户选择的相似度度量问题等。本文针对当前协同过滤推荐算法存在的问题,通过引入混合相似度度量方法、结合专注力编码机制对用户行为数据编码等方法,一定程度上缓解了传统推荐算法普遍存在的冷启动和用户/物品矩阵稀疏问题。本文提出的基于混合相似度及专注力神经网络编码的推荐算法(ACFSI)在Movie Lens 1M数据集上相较于传统推荐算法展现出更加高效、准确的推荐效果。本文的工作主要有:(1)提出一种基于混合相似度的协同过滤推荐算法(CFSI),该算法提升了协同过滤算法计算过程中面向用户、物品计算相似度时的准确度;通过研究传统相似度度量方法,归纳和总结各种相似度度量方法对于用户特征对比的侧重点,寻找兼顾多种特征表达角度的混合相似度度量方法,该方法能够合理兼顾物品自身独有特征和同类型物品共有特征,有效规避噪音。同时通过该算法,缓解了冷启动现象对于推荐系统准确度的影响,提升了推荐算法在相似度度量层面的性能。(2)提出一种基于专注力机制和递归神经网络的编码器(ARSE),该编码器能够根据输入特征矩阵的情况对矩阵进行压缩,利用一个特征编码器代替传统协同过滤系统中用户/物品相似度矩阵本身,将不定长的用户物品评分序列编码为定长的用户特征表达向量,利用各个特征表达向量组合替代巨大的稀疏矩阵,从而达到降低传统协同过滤算法资源消耗过高的效果。同时,通过在编码器输入中加入用户/物品自身特征,一定程度上缓解“忠实用户”和“热门物品”在传统协同过滤算法中的不利影响。(3)根据本文提出的CFSI和ARSE算法,构建一种具有级联结构的新型推荐算法(ACFSI),该算法首先接受用户对物品评分的数据,通过评分数据,构建、训练以输出定长用户特征向量为目标的神经网络编码器(ARSE);之后,编码器输出用户特征表达将被导入到混合相似度的度量算法中,通过基于混合相似度的度量算法(CFSI)的协同推荐框架,对比各个用户的特征表达向量,得出面向各个用户的推荐物品序列。完成推荐任务。该级联算法在提升了推荐准确度的同时实现了对算法空间复杂度的压缩,为推荐算法和相关类似问题的研究提供了基础和参考。
其他文献
目的本研究通过回顾性收集成都中医药大学附属医院感染科门诊上治疗的慢性乙型病毒性肝炎患者的病例资料,对接受不同治疗方法的患者资料进行整理分析,以研究抗病毒三九膏方在
分子筛是一种具有规则孔道且孔径可调的多孔材料,因为具有特殊的微观形貌、丰富的孔道、大的比表面积和稳定的骨架结构,使得其在催化领域有着广泛的应用。金属铜不仅具有与贵金属相似的催化活性,而且在地球上储量更为丰富,价格更为低廉,因此,铜基纳米材料在催化领域掀起了研究热潮。本文将铜纳米粒子(Cu NPs)与分子筛结合并成功制备分子筛基催化剂,并考察其在苯乙烯氧化反应中对产物选择性的影响,进而在苯乙烯氧化反
桩端后注浆技术通过对桩端沉渣和桩侧泥皮的处理,可以有效提高桩端及桩周土体的物理力学性能,能够有效控制桩顶沉降量,提高桩基承载力。近年来,为了进一步提高单桩竖向承载力
路和圈是图论中十分活跃的研究课题,是分析和刻画图的重要工具。2004年,Kawarabayashi提出如下猜想:设n,r为正整数,若n≥max{3,r+1},那么阶至少为n+r的n-连通图满足性质P(n+r,n),即任意给定G中(n+r)元点子集X,G中都存在圈C使得|V(C)n X|=n。本文在前人的研究基础上,对Kawarabayashi猜想进行了深入研究,证明了该猜想当n=8时成立,具体内容
Metabolic analysis provides answers in the diagnosis of many inherited diseases by sensitive and accurate quantification of molecules ranging from carbohydrates
有限群块之间的basic Morita等价以及块的超聚焦子群由L.Puig定义.令p是素数,G,G’是有限群,R,R’分别是群G,G’的正规p-子群,且|G:CG(R)|,|G’:CG,(R’)|是p的方幂.令b,b’
铀是锕系过渡金属元素,具有多种同位素。作为一种重要的核燃料,铀在国防及核能开发利用中扮演着重要的角色。地壳中铀的平均含量约为百万分之二点五。尽管含量比Hg、Bi、Ag要大很多,但人们通常认为铀是一种稀有金属。铀具有放射性及化学毒性,对环境的安全和人体健康具有非常大的损害。事实上,对环境存在危害的铀主要来源于铀矿、核能开发等。因此,对环境中的铀的分析检测是具有十分重要的实际意义。1,6-二磷酸果糖是
黄土高原是我国乃至世界上水土流失最严重的地区之一。经过60多年的治理,黄土高原的生态环境有了极大改善,植被覆盖程度显著增加,有效抑制了土壤侵蚀的发展。北洛河流域(2690
蛋白质磷酸化是蛋白翻译后修饰中最重要的一种,调控着多种生物过程,包括细胞周期、细胞增殖、细胞凋亡、DNA损伤应答等。这些基本功能被整合到一个细胞内,形成了一个完整的网
这项研究的目的是为了调查合作社如何帮助加纳可可种植者增加收入。本研究具有重要的实践意义,因为这将有助于解决加纳可可种植者面临的众多挑战。这项研究主要是为了了解合作社对可可种植者收入的影响、以赋能形式获得的援助以及合作社面临的主要挑战。本研究采用了多种研究方法,通过田野调查、问卷和访谈等方式收集了500名可可种植者的资料。本文基于结构方程模型和图表对相关资料进行分析。具体分析软件是SPSS和AMOS