基于深度学习的融合多源异构数据的推荐算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:pretter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步,与互联网有关的各种新兴的技术急速发展,互联网上各式各样的信息也越发的纷繁复杂,并且引发了严重的信息过载问题。通过深度学习对大量的多源异构数据进行整合,并将其与推荐系统进行深度融合,使推荐模型更加贴合用户的需求,从而提高推荐算法的性能,成为目前融合深度学习的推荐算法的一项十分重要的任务。在实际应用中,由于用户和物品的交互数据十分稀疏,算法无法高效地获取新用户和新项目的重要特征,降低了推荐系统的性能。目前,通过融合相关的辅助数据,如物品的文本描述和标签信息、用户间的信任关系、用户标签数据和其他的用户反馈信息等,来缓解上述问题的一个重要解决方案。这些数据的来源和结构都具有多样性,需要在推荐算法中设置合理的机制,才能将其有效融合,最终提高推荐结果的个性化和准确性。本论文在总结传统的机器学习的推荐算法和目前已有的可用于推荐系统的深度学习方法的基础上,针对存在的问题,建立深度学习模型。(1)融合用户信任关系的非对称深度矩阵分解推荐模型(Asymmetric Depth Matrix Factorization Recommendation Model Based on User Trust Relationship,ADMFT)。模型在深度矩阵分解模型的基础上,融合了用户间的信任关系并针对用户和项目数量的差异进行模型结构的优化。使用了添加社交正则化约束的交叉熵损失函数进行训练。实验结果表明ADMFT模型缓解了协同过滤算法的数据稀疏性和可扩展性等局限性问题,提升了推荐算法的精准度。(2)针对数据稀疏和冷启动问题,提出了融合多源异构信息的矩阵分解模型(Matrix Factorization Model Combining Multi-sourse Information,MFCMI)。该模型融合了用户的个人信息和项目的辅助文本信息。首先,将项目的文本信息的词向量和上下文信息融合,对句子进行充分的表示后,再通过带有门控机制的卷积神经网络对文本特征进行精确的深层次特征提取,使用多层感知机(MLP,Multi-Layer Perceptron)实现个人信息数据的特征提取。然后,根据评分数据,通过矩阵分解模型学习到项目和用户的隐特征,将用户和项目的特征与隐特征融合进行推荐。实验证明MFCMI模型借助对多源信息的融合实现了推荐算法优化和准确率的提升。
其他文献
布鲁氏菌病是世界普遍公认的危害严重的人畜共患病之一。传统布鲁氏菌病原学检测方法阳性率低,操作危险性高,而当前在用的血清学检测技术,其灵敏度、特异性均存在一定的局限性,此外血清学检测样本类型有限,更无法对环境中的布鲁氏菌进行监测。因此,开发一种对人畜及其生存环境、动物制品等潜在的传染源进行快速、灵敏、准确的布鲁氏菌及型别监测的检测方法,可以为布鲁氏菌病的防控提供有力的支持。方法:本文以高灵敏特异荧光
学位
标志标牌与道面标线是道路基础设施与道路安全的重要组成部分,对于引导行车方向、减少交通事故、提高行车安全性等有着显著作用。近年来,随着中国公路养护里程占公路总里程的比例不断上升,公路运营管理和养护的需求也越发强烈,然而,当前我国对标志标牌与标线的养护和管理水平仍然相对较低,主要依赖传统的人工现场观测法,或者通过车载相机或道路检测车录制视频后人工查看回放,这些方法效率低下、严重依赖观察员的主观判断,难
学位
After nearly 30 years of rapid development,the scale and capacity of China’s highway transportation network have been expanding.At the same time,with the continuous extension of service life,a large n
学位
拉普拉斯算子是算子中具有代表性的一种,它也是数学物理等领域用来解决问题的重要数学模型之一.将拉普拉斯算子的特征值从小到大排列,主特征值即特征值中首个非零的特征值,该特征值在研究方程的稳态,即方程解的大时间行为时,有非常重要的意义.拉普拉斯算子主特征值的大小会随着区域的变化而变化,本文主要是在Neumann边界条件下,对拉普拉斯算子主特征值的区域单调性进行研究.通过多个实例,在平面坐标系、极坐标系和
学位
现阶段的以光信号响应为基础的传感技术得到了深入而广泛的研究,研制一种面向全光通信传感与检测器件成为人们的迫切需求。随着材料科学的进步,使得人们可以设计和利用各种功能性材料来制造性能优异的传感器件,为现代传感技术的深入开发与应用带来了新的机遇。螺吡喃类材料因其独特的性质成为研究最广泛的有机光致变色材料之一。螺吡喃类化合物在紫外曝光条件下会产生光致变色现象,分子结构转化为花青素形式,花青素进一步在紫外
学位
癌症是世界范围内威胁人类生命与健康的第二杀手。肿瘤转移是癌症致死的重要原因之一。上皮间充质转化过程(epithelial–mesenchymal transition,EMT)是肿瘤细胞侵袭转移的初始步骤,在启动和促进肿瘤细胞侵袭和转移中发挥着重要作用。神经型钙粘连蛋白(N-cadherin)作为EMT过程中的重要肿瘤生物标志物,其过度表达会导致细胞粘附功能降低,使肿瘤细胞发生转移。胰腺癌是一类侵
学位
水资源对人类生活有着重大影响,人们平日的基本需求、农业养殖、工业生产中水资源都是不可或缺的要素,同时水环境也是生态环境保护中的重要方面。目前我国地表水资源的污染问题依然严峻,为了整治水体污染开展了诸多相关的防治行动。针对污染源和水质相关性方面的需求,提出一套计算污染源对目标水质相关性的方法,该方法主要根据污染源和水质的历史排放时序数据情况来建立污染源和水质预测模型,并计算出污染源对水质的具体影响程
学位
写实油画是源自西方的一种具有着悠久的历史与传统的绘画表达方式。19世纪摄影技术的问世,对写实油画造成了一定程度的冲击和挑战,不仅促使写实油画不断确证自身的独立性,也促使写实油画开始思考摄影技术给写实油画带来的各种影响。作为一门新的独立的艺术语言,摄影艺术在学习写实油画的过程中逐渐获得了自主性,因此,写实油画与摄影艺术在各自发展的过程中,形成了相互渗透与相互借鉴中的关联性。当今,写实油画依然具有广泛
学位
近年来,中国在全球价值链的参与以及分工逐渐深入,中国企业在积极利用海外资本与先进技术的同时,也逐步具备了向海外市场拓展的实力,一批先进的中国民族企业将本国优质产品和服务推向世界市场。在“一带一路”倡议背景下,随着中国制造业的产能释放及其强劲的成本优势,同时得益于互联网持续的全球渗透,企业进入海外市场的模式也发生了深刻的变革和创新。与此同时,随着全球政治、经济、安全问题日益复杂,国际格局演变日益加剧
学位
微流控芯片是一种在微米或亚微米尺度下对流体进行精确操控的芯片,其目的是将实验分析设备微型化和集成化,以最大限度地将实验室的功能集成在一块毫米级别的芯片上。由于微流体的雷诺数小,从而产生明显的层流现象,使得不同溶液之间混合缓慢。微混合器就是快速实现微混合的微器件,是微流控芯片的重要组成部分。体声波激励的微混合器由于具有结构简单、易于操作、生物相容性好、响应速度快等优点而引起了国内外学者的注意。现有的
学位