【摘 要】
:
随着当今社会科技的迅速发展,人工智能、云计算等技术逐渐成熟,不计其数的网络服务使得数据规模与信息体量呈现出指数级别的增长,为了处理这些庞大的数据信息,推荐系统的应用必不可缺。推荐系统需要记录用户历史交互行为中的显式行为或隐式行为,发掘出用户的偏好特征,然后根据产品属性对不同的用户做出不同的推荐。本文对传统在线评论的推荐算法进行两大分类,基于document建模和基于review建模。其中对基于re
论文部分内容阅读
随着当今社会科技的迅速发展,人工智能、云计算等技术逐渐成熟,不计其数的网络服务使得数据规模与信息体量呈现出指数级别的增长,为了处理这些庞大的数据信息,推荐系统的应用必不可缺。推荐系统需要记录用户历史交互行为中的显式行为或隐式行为,发掘出用户的偏好特征,然后根据产品属性对不同的用户做出不同的推荐。本文对传统在线评论的推荐算法进行两大分类,基于document建模和基于review建模。其中对基于review建模的推荐算法在用户偏好会随时间原因等发生改变的问题提出了改进,对基于document建模的算法有预测精度低和用户偏好与物品属性交互低的问题也提出改进,针对以上问题,本文研究工作如下:首先,针对同一个用户对不同的产品在乎的属性权重是不同的问题,本文采用Word2Vec模型对输入的评论内容进行表征,后基于review建模方式对每一条评论进行aspect特征提取,其中添加local-attention机制协助关注方面级特征提取,使用attention机制计算各个方面的权重,后进行特征聚合,并且使用优化的LFM进行结果预测。对算法进行参数调整达到最优MSE和MAE后进行实验比对,实验对比选择基于document建模的aspect推荐算法和基于review建模的两个算法MPCN、TNET,分别使用三组万级公开测试集以80%,10%,10%比例作为训练数据、验证数据和测试数据进行测试,得出结果证明上述理论提出的算法在预测结果上十分好的效果。其次,针对冷启动问题和基于document建模用户偏好和物品属性交互低的问题,本文采用Glove模型对输入的评论内容进行表征,后使用两个平行CNN分别对用户偏好和商品属性进行特征提取,最后进行特征融合,使用PMF进行优化预测结果,本算法由于在于使用Glove模型不同于普通的词袋模型保留了词序并且不用设定数据集的长度,两个并行CNN解决用户偏好和物品属性的交互问题,最后选择PMF解决了矩阵稀疏的问题,后对该算法进行参数调整达到MSE和MAE最优值后进行实验对比,对比实验选择基于document建模的MEUMF、DeepCoNN、D-ATT进行实验比对,实验数据和数据划分方式同上,得出结果证明上述理论提出的算法在预测结果上有十分好的效果。综上所述,本文分别针对当前两类建模的推荐算法分别提出了不同的改进方法并实现,并对最终结果进行分析,基于review建模缓解算力消耗并提升了结果预测值,基于document建模的推荐算法缓解了冷启动问题,增加了用户偏好和物品属性的交互性,并集合Glove模型避开了预设结果集大小的弊端,同样提高了结果预测问题。
其他文献
图像显著物体检测的目的是识别出图像中最重要的物体区域,并将目标区域从背景中剥离出来。由于图像中的显著物体容易受到背景区域的干扰,使得图像显著物体检测非常具有挑战性,为了提高图像显著物体检测的性能,本文对图像显著物体检测算法进行了研究,提出两种图像显著物体检测算法。一种是基于特征增强与融合的显著物体检测方法。该方法首先利用卷积神经网络提取RGB图像的不同卷积层的特征,然后使用图像的高层特征信息指导低
条码作为一种快速识读技术,已经广泛地应用在商品结算、物流运输、仓库管理等领域。常见的有一维条码和二维条码,二维条码广泛地应用在移动支付、电子商务、产品追溯等领域,目前市场上应用的是黑白二维条码,本文将研究如何在黑白二维条码中添加颜色信息,来提高信息存储容量和安全性。本文以目前市场上应用最广泛的QR码为研究对象,为了增大信息容量,将彩色信息附加到QR码点阵图上来传递附加信息,QR码点阵图传递的信息称
随着数字技术的迅猛发展,以及各种强大的图像处理工具的广泛使用,非专业人士可以在不留下任何可见线索的情况下对数字图像进行美化、编辑、甚至修改和伪造,这将破坏图像内容的原始性、完整性和真实性。同时,虚假图像的存在和传播降低了数字内容的可信度,在科学研究、新闻传媒、司法取证、金融和军事等诸多领域造成了严重的负面影响。因此,迫切需要开发功能强大的图像篡改检测工具/算法来识别图像内容的篡改,保证图像内容的原
随着信息化时代的不断进步,二维码由于信息承载量大、编码类型众多、可加密、成本低、易制作等优点应运而生,日渐渗透于人们的衣、食、住、行各个方面。然而,传统黑白二维码逐渐地暴露出自身的不足:一方面,由于二维码是一种由黑白模块构成的矩形码,外观无法满足人们对视觉交互的要求,因此迫切需要对其美术表现形式进行视觉改进;另一方面,传统二维码无法对存储信息进行预读,容易造成误扫。因此,如何优化传统二维码的视觉体
高分辨率图像能够提供较丰富的空间结构信息,是彩色和光谱成像设备的重要发展方向。然而,受成像设备的硬件限制、噪声及传输过程中的压缩等因素影响,采集得到的图像分辨率通常不够理想,易导致所成像场景目标的部分关键信息丢失。因此,在以上成像条件限制下,提升图像的分辨率,即图像超分辨率重建技术,对信息的挖掘和利用具有重要意义。近年来,图像超分辨率已经被广泛应用于监控识别、无人驾驶和医学成像等技术领域,并且已经
图像分割和目标检测一直是图像分析与计算机视觉领域的重点研究课题。随着近几十年来复杂网络理论的快速发展,将复杂网络理论应用到图像分析与计算机视觉领域成为研究人员关注的问题之一。本文以复杂网络理论中的社团检测和节点度分布理论为中心,对图像网络的构建、图像分割和视频中运动目标检测算法进行了研究。具体研究内容如下。(1)提出了一种基于局部网络模块度增量的超像素分割算法(LocalNet)。以像素点颜色相似
数字视频是多媒体技术的一个重要传播途径,被广泛应用于社会的各行各业之中。如何让用户能够快速捕捉到视频的内容,从而决定是否需要继续观看是需要关注的问题。在这样的背景下,视频摘要技术应运产生。视频摘要是一种新的基于内容的视频压缩技术,它能有效地从视频中发现重要信息,消除冗余数据,是对视频内容的概括。近年来视频摘要技术有了很大的发展,但是如何生成高效、准确率高的视频摘要仍然在不断的探索中,本文围绕视频摘
密度峰值聚类算法(DPC)是一种新的基于密度的聚类算法,该算法具有原理简单、高效快速等优点,自从提出以来便引发许多学者的关注,且被广泛应用于图像处理、生物医学、文档处理等领域。同时,人们在应用中也发现DPC算法存在着一些问题:(1)该算法的聚类结果在一定程度上受截断距离参数设置的影响,人为设定的参数值将无法避免主观性与随机性这一问题;(2)样本局部密度的计算方法仅考虑了距离因素,而未能充分考虑全局
聚类算法作为数据处理的一种技术,发展迅速且被广泛应用在图像处理和计算机视觉中。目标检测作为这两个领域的交叉研究学科,同样也倍受关注。随着聚类算法的出现,研究者们开始尝试将其应用到检测中并取得了一些成果。但是,这些目标检测算法常常需要大量的先验条件,并且得到的实物目标也不够完整。针对该缺点,本文重点研究基于密度峰值聚类(DPC)的目标检测算法。为了更改好地将DPC算法应用于图像中,我们对其进行了一系
图像是信息传递的重要载体,在数字图像处理和计算机视觉领域都得到了大量的应用。逆光环境是比较常见的拍摄环境,因此由于拍摄环境造成的逆光图像占据了较大的比例。逆光图像暗区域(有意义区域)通常呈现可视质量低、细节表达不全面、色彩丢失严重等特点,背景区域通常呈现过度曝光、细节丢失、对比度低等特点,从而大大缩小了逆光图像的适用范围。目前专门针对逆光图像增强处理的研究较少,现有的增强算法往往会导致暗区域增强不