推荐系统中的深度矩阵分解方法研究及应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ling401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展,商品种类的日益增多可以为用户带来更良好体验,但同时也带来了信息过载等问题。为用户推荐最适合的产品是各平台提高用户依赖程度的关键。其中,矩阵补全技术是推荐系统中预测用户对项目偏好最为重要的手段之一。目前,已知的矩阵补全技术尽管有着大量的理论知识作为支撑,仍然存在着一定的局限性。由于线性模型无法捕捉现实世界中的非结构化信息,需要在矩阵填补模型中加入非线性操作。例如,现有的矩阵补全模型或是矩阵补全技术,仅仅是与深度网络结合或是算法的单独填补,却没有涉及到推荐背景的融入,亦或是仅用非线性的手段学习用户和项目的表示向量及交互表征,而没有考虑用户和项目的偏置在推荐中的重要作用。为了解决上述问题,本文提出了一个全新的矩阵分解方法,将矩阵分解技术与深度神经网络相融合,通过从矩阵中学习用户和项目的潜在因子表示向量,并学习用户与项目的偏置构建深度矩阵分解模块并对其进行训练。这解决了矩阵分解无法捕捉非结构性信息的问题,并考虑到推荐系统中用户偏好与项目个性化。同时,使用显式数据和未交互的隐式数据进行训练,将用户对项目的偏好转化为隐式反馈,完美利用到了启发式损失函数归一化交叉熵。为解决矩阵稀疏中,部分用户信息存在异常,数据不足甚至缺少的情况,本文提出了一个基于生成数据增强的矩阵分解模型,它受到生成对抗思想和判别式填补缺失数据方法的启发,将预训练好的深度矩阵分解模块作为模型预测部分的初始化输入,然后,利用生成模型的生成数据继续对矩阵分解模型进行训练,最后,利用训练的结果辅助生成器生成选取位置的数据。矩阵分解模块和生成模型二者相互辅助,使预测模型能够利用生成的接近真实的数据学习更准确的用户表示,以达到提升模型效果的目的。最后,将本文构建的深度矩阵分解模块和基于生成增强的深度矩阵分解模型分别应用在公开的观众电影评分数据集和真实的短期用户访问城市功能区域数据集。本文分别在多个数据集上进行矩阵填补并预测用户对项目的喜好情况,通过与其他最新方法对比,本文提出的两个模型都取得了最好的实验结果和应用效果。此外,通过分析在用户访问城市功能区域的数据集上的性能,可以发现本文提出的模型在功能区域推荐等真实世界的应用场景中依然可以发挥很好的作用。
其他文献
文章分析了多模态高中英语听力教学实施的原因,通过对一节高中英语数字型听力课的分析,探讨了融合听、说、读、写、看等多模态、包含“听前导入—听中练习—听后巩固”环节的高中英语听力教学模式,提出开展基于多模态理论的高中英语听力教学的策略。
期刊
毛泽东《在延安大学开学典礼上的讲话》,对中国共产党延安时期探索高等教育的中国经验具有重要的理论指导意义。这篇讲话阐述了一个非常重大的思想理论问题,即中国高等院校的办学逻辑,提出高校办学首先要围绕党的中心工作,服务于国家战略和经济社会发展需要。讲话体现了毛泽东教育思想的核心与本质,体现了实事求是这一毛泽东思想活的灵魂,具有重要的历史价值与现实指导意义。延安大学按照这一办学逻辑展开了卓有成效的办学实践
期刊
癌症被称为恶性肿瘤,是一种恶化非常迅速的疾病,几乎可以发生在人体任何部位。癌症可以使身体的某些细胞不受控制的疯狂生长并扩散到身体的其他某些部位,并且伴随着癌症的恶化发展,存在非常复杂的生理变化。对于不同个体的癌症有着不同基因上的变化组合,伴随着癌症的持续生长,癌症会发生越来越多的变化,即使在同一种癌症中,不同细胞在基因变化上不同的可能性也非常大。因此,本文首先对预癌症密切相关的基因和生物学过程进行
学位
研究表明,神经是肿瘤微环境的重要病理元素。神经与癌症之间的关系是当前癌症研究的热点和趋势,目前通过机器学习算法挖掘神经与癌症关系的研究较少,本文基于文献收集4039个神经基因,然后利用机器学习和统计学方法,探究神经系统在癌症中的功能并且识别癌症转移的神经生物标志物,然后建立癌症神经功能在线分析平台,供研究人员使用。具体而言,本文主要内容如下:(1)癌症转移的神经生物标志物识别。本文识别九种癌症,即
学位
随着互联网的普及,电子产品的功能也更加全面,现实生活中人人都有自己的电子产品并且利用电子产品分享自己的生活,可以看到人们越来越离不开互联网。基于位置的社交网络(Location based Social Networks,LBSN)中的兴趣点(Point of interest,POI)推荐算法使人们能够找到更符合他们喜好的位置,满足他们在生活中的不同需求。然而,因为用户历史签到数据是稀疏的且很难
学位
目的 对渥太华自我伤害功能量表(Ottawa Self-Injury Inventory-Functions,OSI-F)的信效度进行检验。方法 纳入昆明医科大学第一附属医院精神科明确诊断为情感障碍的青少年患者228例,指导完成渥太华自伤功能量表。结果 探索性因子分析显示KMO值为0.811,OSI-F共提取4个维度,各维度累积方差贡献率为60.793%,总条目Cronbach’sα系数为0.84
期刊
脑卒中是困扰我国乃至全世界的重大疾病,具有高患病率、高致残率、高死亡率的特点。重大疾病防治技术及关键器械的研究开发是我国医药领域的重点支持方向。大部分脑卒中患者出院后仍需居家康复,因此脑卒中后居家康复设备有很大的市场需求。感觉驱动是通过触发振动觉刺激大脑进行功能重组,配合经皮电刺激和主动康复能够达到更好的治疗效果,该理论已经被美国FDA临床证明有明确的疗效。促进大脑皮层功能重组是脑卒中后肢体运动功
学位
图像特征提取一直是图像处理领域的一个重要概念,其在目标识别、3D重建等场景均有广泛的应用。SURF(Speeded Up Robust Features)算法是一种局部特征提取算法,通过引入积分图像的概念简化卷积运算,极大地提高了特征提取的速度,同时保留了尺度不变特性和旋转不变特性,但是SURF算法中涉及的大量矩阵运算及浮点数运算很难满足对大批量数据的实时处理要求。FPGA(Field Progr
学位
青光眼是一种患病率较高的眼底疾病,因其不可逆的特性、逐年增加的患病人数、越来越小的患病年龄而愈发为人们所重视。人工进行青光眼疾病诊断耗时耗力,而且难以进行大规模的人员普查。为此,开展基于眼底图像的青光眼自动识别与辅助诊断显得尤为必要。其中,基于视神经乳头的青光眼诊断方法是最具有可行性的一种方法,该方法只需要对眼底图像的视杯区域和视盘区域进行分割提取,通过计算视杯盘比的值,就能辅助医生进行青光眼的诊
学位
近些年由于物联网技术的飞速发展以及越来越多的移动智能设备出现在人们的视野中,移动群智感知作为一种能够聚集大规模、分布式移动用户进行数据收集的范例正在逐渐兴起。移动群智感知可以激励并招募大规模移动用户执行感知活动,使移动用户利用其自身配备的移动智能设备执行大规模的数据收集任务,进而使参与到感知活动中的用户形成一个规模巨大的移动感知网络,最终能够确保平台或任务发布者可以获取较高质量的感知数据。以往传统
学位