基于多路召回的推荐系统设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wmzxpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统媒体时代,信息资讯生产来源短缺,资讯的质量与传播依赖于信息生产者的主观意向,受众的选择空间十分有限,而随着互联网的普及、信息技术的发展,信息过载成为了困扰信息接收者的又一难题。时代进步,一剂良药——推荐算法登上了互联网舞台,图文资讯的个性化推荐逐渐走进人们的日常生活。一个好的推荐算法不仅可以提高资讯的传播效率、增强用户的阅读体验,还可以拓展资讯平台的商业价值,改变产业格局。发展至今,资讯推荐领域仍然有许多亟待解决的问题,譬如算法性能与计算机算力的冲突、推荐出来的资讯质量良莠不齐、算法模型多样庞杂且各有优劣、许多算法距离实际应用仍存在一定距离等。本文针对推荐领域中算法模型多样庞杂的问题,设计并实现了一套基于多路召回的推荐系统,其内核在于根据工业界流行的推荐方案设计角度分别设计相应的推荐算法,通过多路召回的方式来对推荐资讯进行整体把控。其中,本文面向图文资讯推荐系统,主要设计并实现了ALS、Item-based、GBER三种推荐算法,分属于矩阵分解推荐算法、基于物品的协同过滤推荐算法以及基于图嵌入的神经网络相关推荐算法。针对算法性能与算力冲突的问题,本文通过改良物品向量相似度的计算方式,对Itembased算法中向量维度过高的问题进行了有效解决,通过构建新的邻接表存储方式,对GBER算法中的随机游走算法进行了优化;针对用户兴趣长期偏移的特点,本文对资讯序列进行了时间上的分桶,解决了资讯具有时效性的问题,进一步提升了推荐算法的性能;针对推荐系统中资讯特征信息利用不足的问题,创新性地将Word2vec算法与决策树进行了结合,将特征重要性作为神经网络训练地重要参数参与训练,有效地缓和了计算压力的同时提升了算法的推荐精准度。该系统已完成部署并上线良好运行,实验基于的数据集取自于北京微鲤科技有限公司旗下app微鲤看看用户与资讯交互行为以及资讯的特征信息。实验中对比的算法有ALS、Item-based、GBER、双塔模型以及图自编码器,实验关键评估指标有点击通过率CTR、运行时间、召回物品多样性等。本文基于评估指标结果得出了如下结论:GBER算法相较于改进之前CTR提升了17.4%,在已上线算法中CTR最高,有效提升了推荐地精准度;ALS算法召回资讯多样性为7.1,资讯种类丰富,且推荐资讯质量较高;Item-based算法运行时间仅需要8分钟,计算速度快,但算法性能较差。
其他文献
随着高通量方法的发展和成本的降低,大量癌症多组学数据被测量出来。例如,癌症基因组图谱(TCGA)已经收集了来自上万名患者的三十多种癌症的基因组、表观基因组、转录组和蛋白质组等信息,而不同的组学提供了癌症样本的互补和独特特征。与单组学分析相比,多组学数据集成具有显著优势,因为它们能够提供更全面的生物过程视图,揭示复杂癌症的原因和功能机制,并促进精确医疗的新发现。因此,需要能够对多组学数据进行全面分析
随着我国骨干网络光纤化基本完成,宽带接入技术成为了限制有线宽带网络发展的关键因素。在诸多宽带接入媒质中,同轴电缆不仅具有诸多的技术优点,而且在我国已经广泛铺设,所以发展同轴接入技术既能满足高性能宽带接入需求,又符合我国国情,还可降低部署成本。高性能同轴电缆宽带接入(High performance Network Over Coax,HINOC)技术是针对我国有线同轴网络特性研发的具有完备自主知识
随着网络用户数量的爆炸式增长,成千上万的用户数据出现在互联网上,数据安全问题愈加受到重视。访问控制技术通过设置数据访问权限限制用户访问,维护个人隐私数据安全。在诸多的访问控制技术中,基于角色的访问控制(Role Based Access Control,RBAC)通过在系统中构建角色,实现用户与权限的分离,从而降低授权管理的负担,是最常见的一种访问控制模型。如何构建角色是RBAC应用过程中最为核心
随着无人机的广泛应用,无人机成为重要的数据收集节点与数据中继节点。然而,无人机工作环境的开放性以及无人机飞控系统的脆弱性,使得无人机网络面临多种安全威胁。认证密钥协商协议可以提供身份认证和会话密钥共享服务,是保护无人机网络通信安全的最主要的技术手段。然而,无人机网络认证密钥协商协议的设计面临着许多挑战:首先,无人机网络中成员变化频繁,每次新成员的加入均需要与地面站进行认证,现有认证方案计算开销大;
近年来随着扶贫助贫工作的不断推进,暴露出了信息不精准、扶贫资金使用不明晰、公众监督政府监管难度大等问题,这不仅造成了国家财产的损失,也在一定程度上影响了政府的公信力。区块链是一种以链式数据结构为主并按照区块生成时间顺序进行各区块的先后连接的数据结构,其区块的生成主要依靠网络中的共识算法,并使用相关密码学技术来保证数据一致性与安全性。区块链技术的安全、开放、透明、自动等技术特征将为解决上述问题提供新
星地一体化网络利用低轨卫星协同地面通信网络来提供低时延、高带宽的用户接入服务,是未来通信邻域的重要发展趋势之一。在星地一体化网络中,卫星不仅可为地面基站提供高容量回程资源,还可以同地面基站一样具备星上处理和用户接入的能力。通过在星地一体化网络的基站或卫星中加入预缓存机制,整体网络性能可以得到进一步改善。与传统地面通信网络相比,星地一体化网络突破了理想化或是固化的回程容量约束,允许多个卫星为地面基站
随着电磁环境的日益复杂化,雷达逐渐趋向于大带宽、多功能、多波段、小型化等多方向综合发展。传统电域生成雷达信号技术受电子速率的限制,逐渐出现发展瓶颈,无法满足现代雷达系统需求。微波光子学技术整合了微波技术与光子学技术二者优势,具有高频段、大带宽、不受电磁干扰等优点。基于微波光子的脉冲压缩技术可以生成大时宽带宽积雷达信号,是雷达信号生成的关键技术之一。但当前生成的脉冲压缩信号波段数量和功能较为单一,同
随着科技的不断发展,民用安防雷达逐渐走进大众的视野。一方面广阔的边防、油田、码头以及机密单位需要一种不疲倦、不疏漏的小型“哨兵”替代人员值守,另一方面复杂的城市背景下仍需要安防雷达对低慢小目标的检测。脉冲体制的二相码频扫雷达凭借着简单的结构、低廉的成本以及较大的探测威力等优势更适用于安防探测。本文设计并实现了一款适用于多种环境下的低成本二相码频扫雷达,从研究背景出发,分别介绍了雷达方案设计、信号处
数字波束形成(DBF)是天线波束形成原理和数字信号处理相结合的产物,被广泛应用于阵列信号处理领域。数字波束形成技术可以使得某一指定方向的信号获得最大增益,并且有效抑制其他方向的信号干扰。基于数字波束形成技术的阵列雷达数字信号处理系统的搭建是现代雷达技术发展中的热点和关键技术。论文基于窄带数字波束形成原理系统地实现了阵列雷达数字信号处理系统。首先,对窄带数字波束形成算法进行了仿真,验证了数字波束形成
钙钛矿太阳能电池因其激子结合能低、载流子扩散速度快、扩散距离长、吸收系数高、吸收窗宽等优点,近年来一直是光电转换领域的研究热点。经过近十年的快速发展,实验室电池的能量转换效率迅速增加到25.5%。钙钛矿薄膜的结晶质量、与传输层之间的接触程度都影响着器件性能,除此之外,钙钛矿电池器件制备过程中由于退火时间、结晶速率等因素的影响,在钙钛矿内部及界面不可避免地产生大量的缺陷,从而影响器件的效率及稳定性,