基于多任务学习的流程推荐技术研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jeans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
捕捉用户兴趣的发展趋势对于推荐系统和搜索系统都非常重要,用户兴趣是指其在互联网中留下的行为轨迹,利用行为轨迹建模推荐系统,可以预测用户下一次的行为,称为序列化推荐系统。这种推荐系统需要计算用户的历史行为序列,才能推荐下一个行为,因此每当用户有新的行为发生,都需要将其添加到之前的行为序列中重新计算。随着大数据时代的到来,单点预估的序列化推荐系统的线上性能会过负荷。而且,移动互联网的发展很快,用户兴趣变得越来越多样性,如何通过用户的历史行为轨迹为其推荐接下来感兴趣的信息,成为亟待解决的问题。本文提出的基于多任务学习的流程推荐系统,针对用户意图理解、用户兴趣多样性、序列化推荐算法和多任务学习建模四个方面展开研究,主要研究内容如下:(1)提出基于知识图谱增强的意图识别算法——Knowledge-Graph Based Intent Recognition算法,该算法作为推荐系统的召回阶。首先分析了用户意图识别算法的建模方式以及当前的评估指标不能有效衡量结果多样性的问题,针对这个问题本文采用了双塔模型(Deep Structured Semantic Model)作为基础的意图识别模型,利用 BERT(Bidirectional Encoder Representation from Transformers)模型融合知识图谱来捕捉用户的行为轨迹趋势,融合知识图谱能更好的刻画用户意图,提升预估结果的准确度并在一定程度增加预估结果的多样性。除此之外,提出了 BLD算法来优化预估结果的多样性,该方案在预估准确度基本不变的前提下,大幅度提升了结果的多样性。最后,通过离线实验对算法的有效性和准确性进行了验证,实验结果表明,Knowledge-Graph Based Dynamic Intent Recognition 算法可以有效的捕捉用户的兴趣趋势,同时也能增强预估结果的多样性,为后续的阶段提供基础。(2)提出基于滑动推理的序列化推荐算法——Group-Wise Serialized Recommendation算法,该算法作为推荐系统的排序阶段。首先分析了处理较长用户行为轨迹在交互顺序中存在的噪声问题,针对这个问题该算法利用LSTM算法来解决序列高阶信息的长期依赖,滑动CNN算法来建模序列的局部依赖,Attention算法来捕捉与当前意图最相关的信息。最后,通过离线实验对算法有效性和准确性进行了验证,实验结果表明,Group-Wise Serialized Recommendation算法可以有效的提升预估的准确度。(3)提出基于多任务学习的重排序算法——Multi-Task Learning Based Rerank算法,该算法作为推荐系统的重排序阶段。首先分析了召回阶段和排序阶段的问题,由于是基于数据驱动的算法,会存在预估结果不可解释的问题,针对这个问题该算法利用IOP(Inner Order Prediction)辅助任务来对排序阶段产出的结果重新排序,该算法能有效的改善最终预估的准确度。(4)在基于电商数据集上实现了本文提出的推荐系统原型。验证了系统的有效性,并在准确度上有所提升。
其他文献
2018年,我国实行国税地税征管体制改革,分设24年的国税、地税机构合为一家。国地税合并过程中,部分地区机构降级,领导干部人员增加、职数减少、干部岗位作出新的调整等,直接影响到干部的组织公民行为,工作积极性和工作效率受到一定影响,不利于税务机关整体工作开展。本文以国税地税征管体制改革为背景,以X省A区税务局为例,主要运用组织公民行为相关理论,通过文献分析法、问卷调查法、实地调查法相结合的方式,对改
随着我国社会政治、经济的发展,人民素质、生活水平的提高,民众对政府管理及服务提供有了更多的期待和更高的要求。习近平总书记在十九大报告中指出,中国特色社会主义进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。为满足人民对美好生活的需求,我国政府在不断探索。作为传统服务的提供者,政府往往只能满足民众最基本的需求,能够提供的公共产品及服务有限,而人民的需求是
MicroRNA(miRNA)是长度为20~24个核苷酸的非编码小RNA,通过与靶基因mRNA 3’UTR结合进行mRNA的转录后调节。目前对于miRNA通过RISC复合物与特异性的mRNA 3’UTR相结合,调控mRNA转录后翻译过程的机制了解的比较透彻。但是多局限在单一miRNA或单一miRNA家族对特定靶基因mRNA的特异性调控。本课题以pRL-TK荧光报告载体为基本研究方法,构建一系列含有
本文研究的排序问题属于一类新的组合优化问题。这类新问题具有明显的二层结构特征,约束部分是一个组合优化问题的约束,而目标部分则是另一个组合优化问题。例如,给定一个工件集合和一个图,工件和图的顶点一一对应。两个顶点之间有边代表对应的两个工件至少有一个需要被加工。优化问题是寻找一个满足顶点覆盖的工件子集在平行机上的排序,它的最晚完工时间最小。通过人为地为这类新问题的下层约束部分引入一个目标函数,并将该目
本论文研究了光波导中时域非相干光的非线性参量过程,涉及三阶非线性介质(非线性光纤)中的四波混频过程以及二阶非线性晶体(如Ti:LiNbO3波导)中的差频过程。具体内容包括:实验上观测了高非线性光纤中非相干泵浦光与相干信号光之间的四波混频过程,并提出了理论模型解释实验现象。研究表明在普通非线性单模光纤中,非相干泵浦光会降低相干信号光的相干性;理论上研究了在光子晶体光纤中前向四波混频过程中,非相干光泵
欠膨胀超音速冲击射流在许多工程技术领域得到广泛的应用,如V/STOL(Vertical or short take-off and landing)飞行器起飞和着陆、火箭的发射,以及除尘、除水等工程问题;而且其流场结构极其复杂,激波和涡结构之间存在着强烈的相互作用。因此无论是工程应用还是流体力学的基础研究,超声速冲击射流研究都具有极大的挑战性和吸引力。本文使用大涡模拟方法对超声速欠膨胀冲击射流进行
区块链技术凭借着可以在节点间不建立信任前提下进行点对点的可靠价值传递愈发引人关注与研究,被认为是信息互联网转型成为价值互联网的核心技术。区块链架构通过存证链上数据的方式的达到了数据溯源可信的目的,如今正逐渐成为数据存储共享的重要方案。为了突破区块链自身的局限性,越来越多的研究者们将研究重点放在与链下扩展架构相结合的方案研究上。而这将面临着分布式网络可能带来的安全漏洞攻击,使这种链上链下架构面临的安
微分包含系统是非线性分析理论的重要分支,比一般微分方程描述的系统更具有广泛性,例如线性时不变系统,区间系统,多胞体系统等都可以看做是微分包含系统的一种特殊形式。它主要用来满足来两个方面的需要,一是控制论,二是次可微方程的研究,目前已经广泛应用于宏观经济学,社会学和生物科学以及自适应控制系统中。本文我们考虑以下形式的p-Laplacian微分包含系统:其中2≤N

击剑是一种从古老的剑术艺术演变而来的现代运动。是现代奥林匹克运动会的一部分。近年来我国击剑运动员也多次在国际赛事中取得优异的成绩。这些成绩的取得离不开击剑运动员们长时间、高强度的训练。尽管这些活动至关重要,但同时也使得击剑运动员受伤的风险显著增加。因此,本文通过综述击剑运动中常见的损伤及其原因,提出适当的预防损伤的建议,以期减少在训练和比赛过程击剑运动员损伤的发生率,为击剑运动更好的开展提供科学的
关键个体和群体的动态行为愈发复杂,带来的安全挑战也愈发严重。在本文,关键个体的动态行为研究引申为对运动个体下一个轨迹点的预测,关键群体的动态行为引申为区域群体流量的预测。本文从捕捉分析重点关键个体的活动轨迹,通过网络、移动通讯和交通信息收集到位置、时间戳,来捕获人物行为的空间特征、时间特征,预测重点人物下一个轨迹点位置,实现关键个体的轨迹定时可控,具有深远意义;由个体出发,收集到群体信息,通过分析