【摘 要】
:
当前推荐算法中数据种类丰富且表示复杂,传统的推荐算法中使用的数据分析模型和方法,对精度提升效果不理想。缺乏统一的框架对复杂数据进行建模,即便是对同一类数据,数据中蕴含的信息也无法进行分类建模。因此针对以上问题,本文提出对信息进行分类,刻画数据中蕴含的各种信息,将数据中的有效信息挖掘出来,对信息进行相应的归类和建模。本文将用户和项目的交互数据蕴含的信息按照是否可以线性获取分为显式反馈信息和隐式反馈信
论文部分内容阅读
当前推荐算法中数据种类丰富且表示复杂,传统的推荐算法中使用的数据分析模型和方法,对精度提升效果不理想。缺乏统一的框架对复杂数据进行建模,即便是对同一类数据,数据中蕴含的信息也无法进行分类建模。因此针对以上问题,本文提出对信息进行分类,刻画数据中蕴含的各种信息,将数据中的有效信息挖掘出来,对信息进行相应的归类和建模。本文将用户和项目的交互数据蕴含的信息按照是否可以线性获取分为显式反馈信息和隐式反馈信息两种类别,分别按照对应的挖掘方法进行建模。通过对反馈信息的分类构建用以挖掘不同类型信息的模型,进行统一建模表达,有助于提升模型的通用性;而对于不同类型的信息采用有针对性的数据挖掘方法,也有助于优化提升模型的精度。本文的主要工作包括:1、本文首先讨论了在评分推荐算法中显式反馈信息和隐式反馈信息各自的应用场景和优缺点,并介绍了国内外对显式反馈信息和隐式反馈信息的研究现状以及存在的需要进一步提升的问题。接着介绍了传统推荐算法中获取显式反馈信息的协同过滤算法及其分类,以及挖掘隐式反馈信息的深度学习技术及其应用。最后针对当前评分推荐算法存在的一些问题,提出了将显式反馈信息和隐式反馈信息进行融合,弥补两种反馈信息的不足,提出了基于融合信息的评分推荐算法和基于自注意力机制的融合信息评分推荐算法。2、现有的推荐系统中数据量大且种类多,对于数据的表示复杂,缺少统一的框架对数据进行规范的分类。对于同一类数据中蕴含的不同类型的信息,采用不同的有针对性的数据挖掘方法,有助于推荐精度的提升。针对上述问题,本研究提出了一种基于融合信息的评分推荐算法(HGAR),其核心思想是探索交互信息的显式和隐式反馈,以预测用户的评分。将用户项目交互数据蕴含的信息按照是否可以线性获取分为显式反馈信息和隐式反馈信息,根据不同的数据建模目标采用不同的数据挖掘策略。因此,本研究使用奇异值分解模型来获取显式反馈信息,通过多层感知机获取隐式反馈信息,并融合了两部分信息。根据在两个真实的Movie Lens数据集上得出的实验结果,与基于协同过滤和深度学习方法等不同的推荐模型相比,HGAR显著提高了推荐精度。3、HGAR算法很好地解决了现在推荐系统中存在的数据表示复杂、缺乏统一框架对数据分类建模、推荐精度低等问题,但一些有用的潜在交互数据没有被观察到,可能会造成丢失以及对不同类型的信息挖掘不充分等问题。为了解决这些问题,本研究在HGAR算法的基础上,提出了基于自注意力机制的融合信息评分推荐算法(MGSA),将MGSA分为三类信息:显式反馈信息、隐式反馈信息和完全信息。显式反馈信息通过用户对项目的评分等直接交互的显式反馈信息获取。隐式反馈信息通过自注意力机制分别学习用户和项目的特征表示,再通过多层神经网络在大量特征之间捕获高阶的交互,充分挖掘隐式反馈信息。完全信息不划分显、隐式反馈信息,收集用户与项目交互时的所有数据,通过自注意力机制获取交互行为的不同权重,起到补充信息的作用。实验表明,在两个真实的数据集上,推荐精度均取得了较好的提升。对不同类型信息和不同自注意力机制的消融实验,进一步说明了每个模块的有效性和可解释性。此外,算法的时间效率和复杂度分析结果同样表明,该算法能获得更好的性能。
其他文献
蛋白质和RNA分子的相互作用在许多细胞过程中起着重要作用,例如基因表达,转录和翻译。它们之间的相互作用需要先确定哪些蛋白质可以与RNA结合,即确定RNA结合蛋白;其次,该RNA结合蛋白的特定残基将与RNA的特定核苷酸相结合以执行其细胞功能,如果结合错误或失败,那么可能会导致生物细胞功能紊乱,进而引起各种生物遗传疾病。对于RNA-蛋白质相互作用的研究,高通量技术的全基因组预测方法虽然准确性非常高,但
专利数据是人们在生产和科研活动中发明创造的技术信息的集合,可以反映各技术领域中的最新技术动向和发展趋势,是促进自主创新和提高国家竞争能力的战略性信息资源。专利数据不仅包含技术描述文本,还包含发明人、申请人、专利引用及层次标签等信息,丰富的数据种类体现专利数据的异质特性。大多专利分析方法面临大数据学习问题,需要利用表示学习方法,实现对信息的压缩和融合。对专利数据进行表示学习,旨在研究专利文本及其多种
图像信号处理器(ISP)是相机中不可缺少的模组,它负责将来自相机传感器的原始数据转换为具有美感的图像。其中,ISP中的去马赛克算法旨在从单通道原始数据,即彩色滤光片阵列(CFA),中恢复出三通道全分辨率RGB图像。另外,在现实场景中,特别是在夜间环境中,CFA通常会被复杂的噪声所污染。因此,在去马赛克之前,通常需要对CFA进行去噪处理。去噪和去马赛克这两个模块在摄像机ISP中起着至关重要的作用,因
在计算机视觉和模式识别等领域中,图匹配无论是在理论研究还是实际应用方面都是重要的研究课题。图匹配问题旨在建立两个或多个图结构之间的节点对应关系。利用图匹配技术可以获得图数据之间的匹配关系,因此图匹配被广泛应用于图像配准、目标检测、目标跟踪,三维重建、行人重新识别等研究领域中。近年来,随着深度学习的快速发展,研究人员将深度学习与传统的图匹配问题相结合,提出了深度图匹配模型,从而可以获得更高的匹配精度
深度学习技术已经被广泛应用于图像处理和语音识别等领域,主要原因是该技术通过使用深层次的非线性结构能够学习相关数据特征,由此能得到数据深层次特征之间的联系。目前,国内外相关学者和研究人员已经将深度学习技术应用于文本处理等相关问题中,解决了传统机器学习算法存在的无法处理大量复杂数据的问题。但是,现有的字符级文本分类方法在提取关键信息能力方面还存在不足,例如下采样丢失关键信息以及数据稀疏等问题,导致实际
随着计算机技术的快速迭代,人们的日常生活也发生了革命性的变化,计算机视觉技术带给人们巨大的便利。立体匹配是一个基本的三维视觉问题,只需要两台相机即可完成对场景深度的估计,因此可直接应用于机器人、增强现实、摄影测量和视频理解等领域中。同时,热成像设备逐渐地小型化、廉价化、清晰化,相比于常见的可见光成像设备容易受到时间、环境等问题的干扰,热成像设备对光线不敏感的特性愈发受到学者们的青睐。红外热像立体匹
网络表示学习,也称为网络嵌入,旨在将网络中的节点使用低维稠密的向量进行表示,使得表示后的节点向量尽量保持网络中固有的结构相似性和属性相似性。嵌入后的节点向量可以被应用于节点分类、节点可视化等众多网络分析任务中,从而帮助人们快速方便地提取网络中潜在的重要信息,因此网络表示学习具有很重要的研究意义。目前大多数网络表示学习方法是针对固定不变的网络进行嵌入的,而对于一个不断增加新节点的网络则没有归纳表示的
优化问题是指在所有解空间中求取最佳解的问题,如旅行商问题、背包问题和资本预算问题等,较有代表性的经典优化算法,如梯度下降法、共轭梯度法、拉格朗日乘数法等,但是这些经典算法在解决复杂的高维问题和求解全局最优化问题等方面,存在诸多不足,难以得到较好的效果。近年来,群智能优化算法因其适用范围广、操控简单等优点受到了科研工作者的青睐。群智能优化算法启发于自然界中蚂蚁、蝙蝠、鱼群等生物群体行为机制,单个生物
目的 总结慢性阻塞性肺疾病(COPD)患者雾化吸入装置规范应用的最佳证据,为患者能够正确、有效使用吸入装置提供指导,为长期开展雾化吸入实践提供循证依据。方法 计算机检索国际指南图书馆(GIN)官网、新西兰指南工作组、欧洲呼吸协会、加拿大安大略注册护士协会(RNAO)官网、英国胸科协会(BTS)、中国指南网、英国国家临床医学研究所指南库(NICE)、JBI、Cochrane Library、BMJ、
DNA结合蛋白(DBPs)和RNA结合蛋白(RBPs)在基因调控和基因表达中起着至关重要的作用,包括转录和选择性剪接。此外,大量研究表明一些蛋白与人类的疾病相关。因此,准确识别出与DNA/RNA结合的蛋白具有重要意义。由于DBPs和RBPs在生物上具有相似的功能结构,传统方法需要人工提取特征以及需要耗费很大的成本和时间,无法满足目前大规模基因组数据进行测试的需求。因此,如何有效地识别出核酸绑定蛋白