面向用户生成序列的深度学习技术研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:chaba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长久以来,用户生成序列建模一直是推荐系统中研究的热点。传统方法从浩瀚数据中根据用户序列快速筛选出符合用户兴趣的信息,需要花费大量的人力和物力。得益于海量数据和强有力的算力提升,近年来基于深度学习技术的模型在序列建模任务获得巨大的成功。然而,当前对用户生成序列建模的研究仍存在诸多缺陷。对于用户同构序列数据1)未充分将用户体温序列与电子健康病历中多类型特征融合建模;2)忽略对用户签到行为中签到时间的预测建模。对于用户异构序列数据3)未考虑融合序列推荐任务中序列切分和推荐两阶段的工作流。本文分别就用户同质和异质序列数据中蕴含的具体任务进行深入研究,设计数据驱动的用户个性化序列建模框架,较好的缓解了上述问题。本文的主要工作和贡献概述如下:首先,本文从诊断儿童社区获得性肺炎致病微生物的问题入手,提出一种针对患者的注意力机制循环神经网络模型PA-RNN,结合患者在电子健康记录中的生物医学数据,包括血常规和尿常规等特征,同时对随时间变化的体温序列进行联合建模预测。本文在真实的数据集中进行全面的实验,展示将电子健康记录中的多种特征融合对于研究问题的好处。现有的大多基于位置的服务研究专注于提升预测签到地点的召回率,然而对签到地点和时间两方面的联合建模更符合实际的应用场景。对此,本文提出一个深度多任务学习模型ARNPP-GAT,集用户静态表示学习,用户动态行为建模以及点过程于一身。具体来说,模型利用图注意力网络编码用户社交关系为其长期偏好,循环神经网络建模用户当前序列为其短期偏好。与此同时,应用注意力机制到点过程强度函数中以加强其对历史序列的表示能力,并使模型具备预测下一签到时间的能力。在两个真实数据集上的实验性结果表明,ARNPP-GAT比其他基准方法更具优势,验证了多任务学习和社交关系建模的贡献。最后,针对当前基于会话的推荐分为序列切分和推荐两阶段的工作流,本文提出基于深度强化学习的用户序列切分和预测算法RL4SRec,将序列建模的切分和预测两个阶段融合到统一的端到端学习框架。具体的说,切分阶段由策略网络完成,在用户生成序列的每一个时刻执行动作,决定是否在当前位置划分子序列。推荐模型在划分好的用户短序列上训练自身,策略网络则根据推荐模型效果计算累积奖励优化内部参数,循环往复。值得一提的是,RL4SRec能够轻松的与当前的主流推荐模型相结合。本文对三个公开数据集进行实验,证明与使用精心选择的会话切分策略相比,算法在三个基础推荐模型都取得不错的效果提升。综上所述,本文针对多种类型的用户生成数据设计数据驱动的用户个性化序列建模框架,在多个序列数据集上进行实验,实验结果证明了提出方法的有效性。
其他文献
目的:探讨绿茶提取物表没食子儿茶素没食子酸酯(epigallocatechin gallate,EGCG)通过抑制组蛋白去乙酰化酶2(histone deacetylase 2,HDAC2)改善苯肾上腺素(phenylephrine,PE)诱导的小鼠心肌细胞肥大的作用,为临床防治肥厚性心肌病提供新的思路。方法:一、选取1-3天龄新生昆明小鼠为研究对象,酶消化法分离获得新生小鼠心肌细胞,按照随机数字
目的:出血转化是介入取栓治疗急性缺血性脑卒中的主要并发症之一,其严重影响患者预后。因此,本研究旨在探索介入取栓治疗急性缺血脑卒中后继发出血转化的危险因素,通过危险因素建立预测评分模型来早期预测出血转化。方法:回顾性分析遵义地区多卒中中心介入取栓治疗的急性缺血性脑卒中患者的临床资料及取栓参数。通过术后48小时内动态头颅CT平扫将其分为出血转化组和非出血转化组。通过多因素logistic回归分析筛选出
冰结构蛋白(Ice structuring proteins,ISPs)是生物有机体为了适应低温环境而产生的一类特殊蛋白质,主要来源于昆虫、鱼、细菌、真菌和植物等有机体,具有热滞活性、冰晶形态
目的:为了改善双氢青蒿素(dihydroartemisinin,DHA)在体内的复燃率高、半衰期短的缺点并提高抗疟活性,采用DHA模型药物,以碳碳键(CC)、二硫键(SS)、间隔硫(SCS)和单硫键(S)为连接臂,甘油为骨架,合成四种DHA三聚体((DHA-CC)3、(DHA-SS)3、(DHA-SCS)3、(DHA-S)3),并制备成自组装纳米制剂((DHA-CC)3NPs、(DHA-SS)3N
目的:通过制作新生大鼠缺氧缺血性脑损伤(hypoxic ischemic brain damage,HIBD)模型,观察银杏叶提取物注射液(Ginkgo biloba extract,EGB)治疗HIBD过程中磷酸化Tau(phosphorylated Tau protein,p-Tau)蛋白表达情况,为EGB应用于新生儿缺氧缺血性脑病(hypoxic-ischemic encephalopath
石墨相氮化碳(g-C3N4),由于其独特的光电化学性质以及优异的结构稳定性,在光催化和光电转化领域上,引起了广泛的关注。相较于直接通过富氮前驱体热聚合制备的块体g-C3N4,具有
随着节能减排理念深入人心,电动汽车迎来了前所未有的发展机遇,电动汽车空调系统的核心部件涡旋压缩机随之成为了研究的热点。电动涡旋压缩机中动涡旋盘背面与支架体之间存在一定的微间隙,在电动涡旋压缩机正常运行的时候,背压腔中的润滑油有一部分会通过动涡旋盘与支架体之间的环形微间隙泄漏,这就会导致背压腔中背压力的变化,背压力的不足或过大都会影响电动涡旋压缩机的整机性能,若背压力不足,会造成动、静涡旋盘沿轴向方
各种装配中摩擦磨损的存在不仅降低了能量的传输效率,而且显著影响关键零部件的使役寿命。工程上最常用的减摩降耗手段是油液润滑,然而,高温工作环境中,液态润滑剂会迅速降解
文字作为人类高层语义信息中最直接的表示形式,在图像理解中扮演着不可或缺的重要角色。近年来,研究人员针对场景图像中英文、汉字等文字的检测和识别方法已经进行了深入研究,并取得了丰硕成果,但针对复杂场景图像中的蒙古文字检测和识别方法研究还处于起步阶段。在此背景下,本文主要研究内容如下:1.本文研究了一种基于深度学习和最大稳定极值区域(MSER)的场景蒙古文字检测算法。目前,由于缺少大规模场景蒙古文字检测
目的:急性胰腺炎(AP)尤其是重症急性胰腺炎(SAP)有较高的发病率和死亡率。目前的AP特异性评分系统包括多个指标,临床操作复杂,而且在AP患者入院时,没有单一的血清标记物可预测其严重程度及与预后。红细胞分布宽度(RDW)是定量检测外周血红细胞大小、异质性的指标。本研究通过与其他预后评分系统和血清标志物比较,评估RDW对AP严重程度和预后的预测价值。方法:回顾性收集2018年9月-2019年8月西