基于用户评论的跨域推荐模型

来源 :贵州大学 | 被引量 : 0次 | 上传用户:paokahh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统推荐系统仅利用评分数据或少量评论数据等交互信息进行推荐,而这些用户-项目交互占比很小,在信息化时代下,存在严重的数据稀疏和冷启动问题。随着深度学习和神经网络的发展,出现了大量的跨域推荐(Cross-Domain Recommendation,CDR)模型方法,其核心思想是利用从其他领域收集的信息来辅助另一个领域进行。虽然现有的跨域推荐模型方法在一定程度上缓解了数据稀疏性问题,但仍然存在如下一些问题:一是只是简单利用评分数据,没有将用户和项目的其它属性充分利用起来,数据本身挖掘不足,导致成本增加;二是知识跨域迁移难,面临冷启动问题;三是存在数据稀疏和数据不平衡问题。因此,本文为解决以上跨域推荐中存在的问题,进行了以下两方面的工作:(1)针对现有大多数跨域推荐模型方法只是简单利用评分数据,对评论信息挖掘不足,论文提出了一个基于评论细粒度观点的跨域推荐模型(Cross-Domain Recommendation Model Based on Fine-Grained Opinion from Review,FGOR-CDRM)。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好解决跨域推荐冷启动和数据稀疏问题,成为当下跨域推荐的研究重点与难点。FGOR-CDRM模型主要由评论细粒度观点提取、辅助评论增强、跨域相关性学习三个模块组成。首先,将文本卷积神经网络(Text CNN)与门控机制结合,通过设置两个全局细粒度观点矩阵指导查询,有效提取评论信息的细粒度观点;其次,在文本卷积之上增加一层卷积,利用相似非重叠用户的评论构建辅助文档,在增加训练数据多样性的同时有效缓解了数据稀疏;最后,学习跨域细粒度观点之间的相关性,利用静态细粒度观点构建相关矩阵并进行语义匹配,实现目标域冷启动用户对项目的评分预测。在实验中我们选取Amazon数据集中的Book、Movies and TV、CDs and Vinyl三个类别形成三个数据领域对进行实验。实验结果表明,FGOR-CDRM模型在三个数据领域对下的表现均优于其它基准模型,以“电影-图书”数据领域对为例,FGOR-CDRM模型的MAE比基线模型中ANR模型提高6.09%,比CDLFM模型提高3.58%;(2)针对在跨域推荐系统的数据稀疏性、数据不平衡以及信息迁移难问题,论文提出了一个基于GAN的用户评论跨域推荐模型(Cross-Domain Recommendation Model of User Review based on GAN,CDUR-GAN)。首先,在CDUR-GAN模型中加入用户评论信息和图片信息,以便充分利用数据,并为用户、项目及其交互学习可迁移的潜在表示;其次,在判别器中融入注意力机制,在判别器输出叠加之后,加入Attention层,以训练提升生成器模型的推荐准确度和稳定性;最后,采用对抗域自适应技术的思想,针对推荐系统领域重新进行改进,将对抗域自适应技术应用到跨域推荐领域,使得目标域中的用户-项目交互尽可能靠近源域评分特征,以解决在跨域之间信息迁移难的问题。在实验中,选取Amazon数据集中的Digital Music、Music Instruments、Home&Kitchen、Office Products、CDs五个类别形成三个数据域对进行实验。实验结果表明,CDUR-GAN对比基线模型中表现最好的ANR模型,在三个数据域对下MAE分别取得了6.46%、9.06%、3.75%的提升,MSE取得了6.84%、4.87%的提升。
其他文献
本篇论文中给出了两个最主要的结论,其中之一是关于离散Appell多项式的一个对称恒等式,另外一个恒等式是关于Pell数列、Pell-Lucas数列的幂次和二项式系数的关系.多项式、特殊函数和组合数的研究在数论、组合数学中的应用非常广泛,其中,Appell多项式是一类重要的多项式序列,也是本篇论文中着重讨论研究的多项式.同时,Pell数和Pell-Lucas数也是重要的二阶线性递推数列,为了加深二阶
学位
跨境电子商务作为一种促进交易即时高效完成的新业态,打破了传统外贸时间和空间的限制。在政府政策的支持下,越来越多中小企业抓住跨境电子商务的机遇,加入跨境出口电商平台开展经营。然而,跨境电子商务活动中,平台内经营者面临许多挑战。一方面,其企业规模较小,资金能力和运营能力有限,导致抗风险能力下降;另一方面,平台环境不确定性日渐增加。在此背景下,如何实现跨境出口电商平台内经营者的快速和持续发展,是亟待研究
学位
凸优化模型与算法是当前优化领域内的研究热点,带有线性约束的可分凸优化问题是其中比较常见的一类.交替方向法乘子法(ADMM)已被证明是求解两块线性约束可分凸优化问题的较为高效的简单方法.随着生活中优化问题规模的扩大,所求解模型的目标函数变量远远大于两组,但直接推广至多块的ADMM类算法在理论上无法保证收敛性.为了保留直接推广至多块ADMM算法的优良效果,同时又能保证算法的收敛性,一些变形的多块并行A
学位
方面级情感分析(Aspect-based Sentiment Analysis,ABSA)旨在分析给定句子中某一方面的情感倾向,主要涉及方面抽取(AE)、观点抽取(OE)、方面情感分类(ASC)和方面情感三元组抽取(ASTE)四个子任务。通常将方面级情感分析视为序列任务,并基于词序或依存句法树建模。但仅考虑其中一种结构信息无法完整表示词之间复杂关系,这限制了模型学习性能。针对该问题,本文提出一个新
学位
随着网络时代的迅速发展,优化问题作为一类数学基本问题越来越受到重视.其中线性约束凸优化问题的求解在许多领域有着广泛的应用,因而是最优化理论求解线性约束问题的一个热点,在此背景下求解凸优化问题的算法也有了极大的发展.本文考虑求解线性等式约束和不等式约束的凸优化问题.増广拉格朗日方法是求解此类问题的经典算法.在此方法上衍生了诸多算法,比如邻近项増广拉格朗日方法、线性化増广拉格朗日方法等.近期的文献平衡
学位
在线教育在日常教育活动中的比重迅速增加,已成为一种必不可少的教育方法。面对海量的课程资源,传统信息搜索方式存在“信息迷航”、“课程资源超载”等问题。课程推荐技术是学习者与课程资源快速匹配的关键。传统序列推荐方法大多针对用户自身序列编码,忽视了序列间的联系。同时对行为日志数量不足的用户存在冷启动问题。本文针对上述行为日志推荐算法存在的问题进行相关研究,主要研究成果如下:(1)提出基于行为日志的课程推
学位
新疆地矿局在长期地质工作中积累了多专业、海量的地学数据资源。如何借助信息技术科学存储、集成、管理并充分利用这些宝贵资源,使之发挥最大作用和价值,成为我们面临和亟待解决的一个重要课题。本文重点探讨了建设“新疆地学基础数据中心”平台的可行性。
期刊
本文主要研究了时滞型分数阶差分定义的几类混沌映射及其稳定性条件.主要分为如下六章:第一章,介绍了分数阶差分方程的历史发展背景,阐述了分数阶差分定义下的混沌系统和稳定性的发展现状,应用前景和研究必要性.第二章,回顾了分数阶微积分,整数阶差分与分数阶差分理论的定义和运算性质.第三章,简要地介绍了混沌的定义与特征,几类经典的混沌映射,分数阶混沌映射,并提出了一类带有q弯曲参数的分数阶混沌映射,最后进行了
学位
序列推荐算法根据用户过去的交互序列向用户推荐下一个可能感兴趣的物品。其关键技术之一是学习序列交互的隐表示,以捕获用户偏好,从而给用户提供准确的推荐结果。本文立足于对用户行为序列进行建模,利用变分自编码器优秀的可扩展性,结合多种深度学习方法,研究如何提升用户隐变量的质量来提升模型的推荐性能。主要工作如下:(1)序列推荐模型通常使用用户的历史行为来获得用户偏好表示以产生推荐。大多数方法学习到的用户表示
学位
本文探讨了集优化问题的适定性与解的稳定性.将集优化问题按集序关系分成三类研究.第一章是引言与预备知识.对优化问题的研究背景及现状作了介绍.简述了集优化问题的适定性及解的稳定性研究概况.说明了本文的主要工作.第二章引入了集优化问题带扰动的B-适定性概念,得到了相关B-适定性的判定准则和特征,建立了逐点B-适定性和全局B-适定性之间的关系.第三章引入了集优化问题带扰动的广义l-适定性概念,得到了此类适
学位