基于深度学习的个性化推荐方法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:koala01250708
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是购物、教育、新闻和娱乐等互联网平台中解决信息过载的重要技术,是信息检索和数据挖掘等领域的研究热点。该技术已成功应用于各种互联网平台的产品、内容和服务的个性化推荐。它不仅能最大限度挖掘用户偏好和帮助用户获取感兴趣的个性化信息,也能在保持用户良好体验的同时达成互联网公司的商业目标。随着深度学习和自然语言处理等技术的发展,推荐领域形成了基于机器学习的混合推荐方法。相比传统的基于协同过滤的推荐方法和基于内容的推荐方法而言,该类混合推荐方法能够从多源异构数据中挖掘序列信息,以及自动提取用户和项目丰富的隐藏特征,能够更有效地反映用户的不同偏好以实现个性化推荐。此类方法已经得到了学术界以及工业界的极大关注,在未来必将会得到更广泛和更深入的研究和应用。当前基于深度学习的混合推荐方法,虽然一定程度上解决了传统推荐方法中特征提取依赖人工、难以从多源异构数据提取特征等问题,但是容易忽略结构化数据中组合信息和整体信息蕴含的丰富隐藏特征,也容易忽略文本数据(非结构化数据)中存在单词稀疏和单词同义等问题。此外,现有基于深度学习的混合推荐方法属于高度依赖标注数据的有监督学习方法,在新领域、新系统或者隐私保护极度严格的环境中难以收集可用人工标注数据(或者标注数据规模过小),导致难以训练出可用模型。因此,在恶劣环境中解决冷启动问题是推荐领域迫切需要解决的科学问题,具有重要的研究意义。针对这一亟待解决的且具有挑战性的科学问题,本文在注意力机制、记忆回放机制和神经网络的适应性改进等方面展开了深入研究,具体内容如下:首先,针对传统推荐方法存在的数据稀疏、冷启动难和特征提取过度依赖人工等问题,本文提出了基于“字符-短语”注意力机制和因子分解机的混合推荐方法。一是注意到评论文本中核心词汇以及重要短语对特征提取均有影响且存在差异,分别提出字符级注意力和短语级注意力,共同形成了基于自然语言处理的“字符-短语”注意力机制,从局部到整体两个不同粒度对用户和项目的评论文本进行分析,从中挖掘核心词汇以及重要短语对目标特征的影响。二是基于“字符-短语”注意力机制构建双列卷积神经网络(Convolutional Neural Network,CNN)同时挖掘用户和项目的隐藏表达特征。三是利用因子分解机从它们的隐藏特征中挖掘关联关系,形成一种先进的混合推荐方法(ACNN-FM)。其次,针对单个用户在具有海量签到数据规模的个性化兴趣点(Point-Of-Interest,POI)推荐中,存在数据稀疏、冷启动难和难以挖掘出有价值的长尾POI的问题,本文提出了一种可以有效提升数据利用率的基于“局部-整体”注意力机制的个性化兴趣点推荐方法(HAM-POIRec)。该方法为了从有限的数据中挖掘更多隐含特征,提出了显式特征和隐式特征的概念,可以指引基于深度学习的POI推荐方法提供选择数据和计算模型的思路;提出一种“局部-整体”结构的注意力机制,在局部关注单个特征对POI推荐的贡献度,在整体上挖掘组合特征以及整体特征对POI推荐的贡献度和蕴含的隐藏特征;在POI推荐领域首次提出了基于自然语言处理的“用户-POI”匹配度计算机制,并用该机制微调用户的POI推荐列表实现更高精度的推荐。最后,为了解决深度强化学习方法(Deep Reinforcement Learning,DRL)在推荐领域存在的用户项目数量过大且动态可变、动作空间高度离散和环境交互反馈极度稀疏等问题,以实现不依赖人工标注数据的强化推荐方法,本文提出了一种基于层次注意力和增强经验优先回放机制的深度强化推荐方法(HEDRL-Rec)。该方法提出了一种基于层次注意力机制的行动者(Actor)神经网络,有效挖掘用户(或项目)状态的局部特征和整体特征(含组合特征)所蕴含辅助信息以及对推荐结构的重要程度;同时,提出了一种既重用历史经验又考虑经验重要性不同的增强经验优先回放机制,缓解模型过拟合的同时可以解决DRL中样本不均衡、难以收敛和学习效率低的问题;进而,融合提出了基于深度确定性策略梯度网络结构(Deep Deterministic Policy Gradient,DDPG)架构的深度强化推荐训练方法,有效保证了模型的可收敛和可拟合,较好地缓解了推荐领域的冷启动问题和实现了不依赖人工标注数据的个性化推荐。
其他文献
四溴双酚A(TBBPA)和双酚A(BPA)属于两种典型双酚类新污染物(Emerging Contaminants,Ecs),此类污染物虽然在环境中的丰度较低,但能以各种方式进入环境和生物体中,严重威胁生态环境和人体健康。目前,虽然有大量研究涉及此类污染物的毒理学效应、分布、归趋及污染特征等,但尚无简单、灵敏、快速的分析方法用于这两种污染物的现场检测。针对于此,本研究构建了基于抗原-抗体特异性识别的
学位
在非线性鲁棒控制方法中,传统滑模控制凭借其动态响应速度快与抗干扰能力强而广受关注。然而,传统滑模中存在的抖振和相对阶限制问题极大地限制了其发展与应用。二阶滑模的提出,不但解决了传统滑模中存在的抖振和相对阶限制问题,而且保留了传统滑模控制的强鲁棒性优点。注意到现有的二阶滑模控制理论仍然处于发展阶段,还有许多亟待解决与完善的问题。本论文将对其中若干理论问题展开研究,主要包括如何改善传统超螺旋二阶滑模算
学位
LA-ICP-MS原位微区分析技术具有空间分辨率高、检出限低等突出优点,可以有效地获得矿床不同成矿阶段矿物的微量元素组成信息。黄铁矿广泛分布在不同类型的金矿床中,是认识矿床成因的一个重要载体矿物。文章总结了近些年来LA-ICP-MS分析技术的发展趋势和其在分析黄铁矿微量元素指示金矿床成因方面的研究进展。研究提出在详细的岩相学工作基础之上,利用LA-ICP-MS原位微区分析技术准确测定黄铁矿微量元素
期刊
近年来,有机金属卤化物钙钛矿半导体材料因其优异的光电特性、高的缺陷容忍度,可调的光学带隙以及低的制备成本等优势在光伏、光电研究领域取得了快速的进展。相比于广泛研究的微晶钙钛矿薄膜,单晶因不存在晶界而具有更低的缺陷态密度,更好的电荷传输特性以及更高的稳定性,在光电器件应用,尤其是光电探测器方面的应用,具有非常明显的优势。然而,铅卤化物钙钛矿中含有高毒性的铅及其器件的长期工作稳定性等问题仍然是钙钛矿单
学位
细胞活性检测技术在细胞培养研究、肿瘤免疫疗法、细胞毒性试验、抗癌药物测试、耐药性研究以及细胞侵袭实验等诸多领域都有着十分广泛的应用。传统上,细胞活性被定义为活细胞数在总细胞群中的占比;然而,由于单个细胞存在异质性,导致相同数量的细胞群对药物响应的结果差别很大,造成细胞活性评估不准确且不稳定。现有细胞活性检测方法,如MTT法、XTT法和CCK-8法,都属于有标记、有损伤的终点检测法,一定程度上损害了
学位
量子纠缠和量子相干不仅是量子力学区别于经典力学的基本特性,还是实现量子计算、量子保密通讯等量子信息处理任务的重要资源,也是近年来量子信息理论研究的热点.本文利用算子代数与矩阵分析中的理论与方法,系统地研究了基于测量的量子纠缠刻画、基于信道的量子相干以及量子相干的估计问题.全文共分六章,内容如下:第一章,介绍了本文的研究背景、研究意义及研究现状,并给出了本文的主要结果.第二章,首先,回顾了一些量子力
学位
由于抗生素等药物的过度使用导致动物源食品的不安全引起了全世界的高度关注。大量科学研究表明,富含多肽的发酵饲料对于提高动物的免疫力、改善动物营养有重要的价值,已经成为了解决饲料抗生素滥用问题重要的选择之一。目前已经有企业在利用家禽羽毛进行非禽类动物饲料多肽的制备。角蛋白酶是将动物羽毛蛋白转化成活性多肽的重要酶之一,地衣芽孢杆菌(B.licheniformis作为安全的菌种可在发酵中产生一定量的角蛋白
学位
随着物联网的快速发展,气体传感器的应用已经渗透到环境监测、医疗诊断、工业生产、资源勘探、家庭生活、消费电子等各个领域。金属氧化物半导体(MOS)气体传感器由于其独特的优势而展现出巨大的应用潜力。然而,MOS气体传感器仍然存在一些亟待改善的问题,如响应值低、响应恢复慢或不能完全恢复、电阻高、对低浓度的气体不敏感、工作温度高、选择性和稳定性差、敏感机制仍不明晰等问题。敏感材料是气体传感器的核心,设计和
学位
多属性决策问题是决策理论中的重要组成部分,其主要是通过综合考虑多个属性指标和因素有效地为人们提供最优方案或给出具体的排序结果.然而,经典的多属性决策问题常受到决策者自身认知的模糊性和事物之间关系复杂性的限制,故有关模糊决策理论的研究应运而生.有关模糊决策理论的探究大致集中于模糊集、区间值模糊集及犹豫模糊集等形式的信息测度和聚合算子两方面.目前,基于不同形式的信息测度和聚合算子的讨论已取得了众多优秀
学位
教研论文发表是每位教师梦寐以求的事情。选择适合自己的专业期刊,在平时的教育教学工作中坚持边读、边研、边写,通过积累不断提升教研论文写作水平,才能获得编辑的垂青。
期刊