基于Gumbel分布和双优化器预测推荐系统中的非平衡评级的方法研究

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:littlev19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评分预测是推荐系统中的一个核心问题,用于量化用户对不同商品的偏好。由于训练数据中评级分布的不平衡,现有的推荐模型通常会产生有偏差的预测。因此,它们在预测长尾样本的性能通常不能令人满意。针对上述问题,本文提出两个解决方案。第一个模型命名为TADO(Time-v arying Attention with Dual-Optimizer Model)。此方法在第三章进行详细介绍。TADO专注于解决基于评论推荐模型中存在的三个主要问题。首先,降低传统模型在稀有评级中的预测损失。为此,TADO提出了一种灵活的双重优化器模型,以从回归优化和分类优化中获得更加的模型性能。其次,传统基于评论的推荐系统模型使用词向量编码文本信息,然而,词向量编码的方法无法理解文本评论句子中的深层语义表达。因为,同一个单词在不同句子中有不同的语义,但词向量对于固定单词有固定的表达。为了解决词嵌入导致的上下文信息提取能力不足的问题,TADO首先将BERT(Bidirectional Encoder Representations from Transfo rmers)引入基于评论的方法中,以提高语义分析的性能。第三,现有方法忽略了用户随时间变化的偏好特征信息。因此,TADO提出了一种具有双向长短期记忆和多尺度卷积神经网络的时间特征提取模块。最后观察到传统模型,只着重于使用文本评论建模用户偏好和商品特征的过程,而忽略了两者之间交互的结果,即用户商品交互向量只发生在最后一层。为了解决这一问题,TADO引入了额外的交互层,采用残差连接,同时保留了用户和商品各自的特征,以及其交互的特征。受极值分布(EVD)在稀有数据分布建模方面的出色能力的启发,本文第二个方法提出了一种新颖的基于Gumbel分布的评级预测模型GRP(A Gumbel-ba sed Rating Prediction)。该模型是一个灵活的框架,可以同时准确预测少数类别和多数类别的评级。在GRP,首先为每个评分级别定义不同的Gumbel分布,这可以通过用户和商品的历史评分统计来获得。其次,GRP提出的多尺度卷积融合层,将基于Gumbel的用户和商品表示与从评分矩阵/或评论中学习到的原始表示结合在一起,以丰富用户和商品的表示。第三,GRP提出了一个数据驱动的评级预测模块,使用高度压缩的特征向量和原始比率比率特征以预测用户对商品的评级。TADO在Amazon Product Reviews的23个基准数据集进行了广泛的实验。与最近提出的几种最新方法相比,TADO平均获得了明显高于ALFM,MPCN和ANR的精度,分别为20.98%,9.84%和15.46%。进一步的消融实验展现了TADO每个组件对最终模型表现的贡献。GRP在Amazon Product Reviews的8个数据集上进行实验,对比了7个基准模型,分别为:PMF,Neu MF,Deep Co N N,ANR,NARRE,NRPA,TDAR,使用流行的推荐系统指标:MAE,F1,HR,NDCG。广泛的实验结果表明:1)GRP在所有八个数据集上均达到了最先进的总体性能;2)GRP在预测稀有评级方面取得了实质性的进步,这显示了GRP在解决偏差预测问题方面的有效性。
其他文献
罗非鱼是我国南方最主要的淡水养殖品种之一。目前,罗非鱼多以初级加工为主,产品形式较为单一且附加值较低,而运用生物发酵技术不仅可以有效解决淡水鱼鱼糜热凝胶出现的凝胶劣化问题,还可以提高其口感和风味,对淡水鱼的高值化利用具有重要意义。本文以罗非鱼鱼糜为研究对象,首先通过研究罗非鱼鱼糜自然发酵过程中微生物群落结构变化对其品质及风味形成的影响,明确功能性微生物种类,进而利用选择性培养基定向分离筛选相应的微
文化是一个国家,一个民族的灵魂。维护和保障人民群众的文化权益,有以利于坚定文化自信,增强文化自觉,是中国特色社会主义进入新时代大背景下,坚持以人民为中心,建设社会主义文化强国的重要举措。公共文化服务均等化是指在政府主导,社会参与的原则下,通过政策制定、资金投入、产品供给、队伍建设等一系列举措,完善公共文化服务体系,实现地区与地区之间公共文化服务水平的大致相当,是提升社会公共服务总体水平,促进区域、
本论文报道了不同养殖模式下三角帆蚌的生长发育及几个环境因子的研究结果。研究内容分为4部分:(1)池塘养殖条件下三角帆蚌生长情况和(2)河道养殖条件下三角帆蚌的生长情况;(3)三角帆蚌的性腺发育评价;(4)养殖水体浮游植物及水质因子分析。研究结果如下:三角帆蚌的整个生长周期,60至180日龄(秋季后期和冬季前期)壳长、壳宽、壳高是快速增长的阶段,180到270日龄出现增长延缓,180至270日龄(冬
学位
随着抗菌剂的大量生产和广泛应用,越来越多的抗菌剂会经由各种方式排放入环境,极大威胁生态环境和人类健康。排放入环境中的抗菌剂往往是低剂量和混合暴露的,低剂量的抗菌剂可能会对生物体产生低浓度促进而高浓度抑制的Hormesis效应,而抗菌剂混合暴露时往往会产生交叉现象。交叉现象是指当使用模型法判别混合物的联合毒性作用时,混合物实际的浓度效应曲线(concentration-response curve,
近些年,抗生素在医疗、畜牧及水产养殖行业应用日益广泛,过量的抗生素以原物或代谢物的形式通过人体和动物的排泄进入环境中,使得近年来我国水体及土壤中抗生素的检出屡见不鲜。抗生素自身的物理化学性质使其难以被机体完全吸收利用,因此大多数抗生素被排放进入环境,但由于目前水处理系统的局限性和抗生素自身的难降解性,使其残留在环境中成为新型污染物,因此,清洁高效地解决抗生素残留问题是当下研究的热点。目前已有许多研
海洋溢油灾害是海洋环境中最受关注的问题之一,对海洋生态环境造成了巨大的危害,因此,海洋溢油发生之后,准确及时地对溢油进行检测,并根据检测结果制定相应的措施,不仅是将损失降到最低的重要措施,也对海洋环境保护和生态资源开发具有重要意义。由于海上溢油检测的特殊性,需要进行大规模检测,利用遥感技术对海上溢油进行大范围、大面积的连续观测成为最有效的溢油检测方式之一。全天时,全天候的合成孔径雷达(Synthe
随着我国水产养殖规模的进一步扩大,进入市场流通的水产品总量逐年增加。目前先进的信息技术未在水产交易中使用,对于水产交易中计量数据的采集,还处在手动录入的阶段。为保障水产交易中计量数据的可靠性,维护水产养殖户和收购商的经济利益,本文提出了一种将区块链技术与物联网技术相结合的水产交易计量数据采集、传输与存储模型,该模型包括三个部分数据采集平台、基于区块链的数据传输安全以及基于区块链的数据存储安全。数据
我国水产品总量连年上升,水产养殖规模也愈发扩大。对养殖区域内的水质进行严格管理和把控,将直接关系到水产养殖的经济成果。目前常规的水质监测系统存在成本高、控制反应慢、采集数据精度低、不能预测数据等不足。为了解决常规水质监测系统中存在的问题,提高对水质的精准管理能力,增强水产养殖过程中的风险防范能力,本文展开了以下的研究:一、设计具有较高精度的水质数据采集系统。基于超低功耗芯片和高精度传感器设计的水质
图像数据作为大数据的一种常见表现形式,早已呈现出爆炸式增长的趋势和海量而冗杂的特点,面对海量图像数据的检索分析与存储管理,设计高效、精确的图像检索策略成为了当下的重要课题。作为近期的研究热点,图像检索技术在基于深度神经网络的图像检索方法已取得了诸多进展,特别是在差异性较大的图像检索方面效果较优,但在差异较小的图像检索方面还存在较大的提升空间,如不同种类鸟的图像检索。在图像检索的过程中,度量和评价各