【摘 要】
:
隐式反馈具有数据获取成本小、形式广泛的特点,因此在现代推荐系统中被广泛使用.由于用户的隐式反馈通常是稀疏,不平衡,且含义不明确的.因此,想要准确学习用户和物品之间的复杂交互具有挑战性.传统的基于矩阵分解的推荐方法只能建模用户-物品之间的相似性.同时,矩阵分解使用点积运算作为相似度评估方式,而点积运算不满足三角不等式,即不能将用户-物品相似性传递到用户-用户以及物品-物品的相似性建模.因此,矩阵分解不足以在隐式反馈中充分建模用户和物品的关系.尽管现在有基于隐式反馈使用欧式距离来度量用户-物品相似度的度量学习
【机 构】
:
浙江大学计算机科学与技术学院 杭州 310007;埃默里大学计算机科学与技术学院 亚特兰大 30322 美国
论文部分内容阅读
隐式反馈具有数据获取成本小、形式广泛的特点,因此在现代推荐系统中被广泛使用.由于用户的隐式反馈通常是稀疏,不平衡,且含义不明确的.因此,想要准确学习用户和物品之间的复杂交互具有挑战性.传统的基于矩阵分解的推荐方法只能建模用户-物品之间的相似性.同时,矩阵分解使用点积运算作为相似度评估方式,而点积运算不满足三角不等式,即不能将用户-物品相似性传递到用户-用户以及物品-物品的相似性建模.因此,矩阵分解不足以在隐式反馈中充分建模用户和物品的关系.尽管现在有基于隐式反馈使用欧式距离来度量用户-物品相似度的度量学习方法,使得对应的推荐方法能够满足三角不等式.但是,现有的度量方法通常会将每个用户或者物品表示为度量空间中的单个点,进而在单个空间内通过用户-物品之间的距离来表征用户-物品之间的相似性.由于在不同的环境下,用户对于同一种类型的物品的偏好也可能存在差异.基于单个空间的用户、物品嵌入向量有可能无法满足用户具有的多种偏好和物品具有的多种属性,进而限制了推荐系统的性能.为了充分刻画用户和物品,我们尝试从多个侧面对于用户和物品进行表示,并提出了一个基于多空间的度量学习(MML)框架.通过设计整合多个空间相似性的度量方式,我们将用户和物品投影到多个空间中进行细粒度的表示.另外,我们设计了一种经过校准的优化策略,包括经过校准的最大间隔损失函数和经过校准的采样方法.在保持多空间度量学习表示能力的同时,确保框架的有效性.最后,模型通过训练好的用户、物品向量,对于稀疏的用户-物品交互矩阵进行填补.在动态更新空间权重的同时,可以赋予模型新的训练视角,最终实现端到端的训练.通过四个真实世界推荐数据集上进行的大量实验表明,MML可以在Recall和nDCG衡量指标上将目前最优的对比算法提高40%以上.
其他文献
为了解决单一军事领域语料不足导致的领域嵌入空间质量欠佳,使得深度学习神经网络模型识别军事命名实体精度较低的问题,文中从字词分布式表示入手,通过领域自适应方法由额外的领域引入更多有用信息帮助学习军事领域的嵌入.首先建立领域词典,将其与CRF算法结合,对收集到的通用领域语料和军事领域语料进行领域自适应分词,作为嵌入训练语料,并将词向量作为特征与字向量拼接,以丰富嵌入信息并验证分词效果;然后对训练所得的通用领域和军事领域的异构嵌入空间进行领域自适应转换,生成领域自适应嵌入,并作为基础模型BiLSTM-CRF层的
蛋白质可溶性在药物设计的研究中起着重要的作用,传统生物实验测试蛋白质可溶性费时费力,因此基于计算方法对可溶性进行预测成为一个重要的研究方向.针对传统可溶性预测模型不能充分表示蛋白质特征的问题,文中设计了一种基于多种蛋白质序列信息的神经网络模型PSPNet,并应用到蛋白质可溶性预测中.该模型首先使用氨基酸残基序列嵌入信息和氨基酸序列进化信息表示蛋白质序列;然后采用卷积神经网络提取氨基酸序列嵌入特征的局部关键信息;其次利用双向LSTM网络提取蛋白质序列远程依赖特征;最后利用注意力机制将该特征与氨基酸进化信息融
随着视频处理技术的迅速发展及硬件成本的不断降低,监控设备得到了越来越广泛的应用.视频监控普及所带来的隐私问题泄露逐渐成为了研究热点.根据目前视频隐私保护领域的研究现状,将视频隐私保护方法主要分为隐私主体识别、隐私主体保护以及隐私信息管理3个阶段,对每个阶段的算法进行分类概述并分析其优缺点,其中视频区域保护作为视频隐私保护领域的重要组成部分,联系视频编码发展历程对保护方法进行了分析和比较.最后探讨了视频隐私保护领域目前存在的问题并对未来的研究方向进行了展望,为视频隐私保护的相关研究提供了参考.
深度强化学习(Deep Reinforcement Learning,DRL)方法在大状态空间控制任务上取得了出色效果,探索问题一直是该领域的一个研究热点.现有探索算法存在盲目探索、学习慢等问题.针对以上问题,提出了一种快速收敛的最大置信上界探索(Upper Confidence Bound Exploration with Fast Convergence,FAST-UCB)方法.该方法使用UCB算法探索大状态空间,提高探索效率.为缓解Q值高估的问题、平衡探索与利用关系,加入了Q值截断技巧.之后,为平衡
云存储的发展使人们愿意将个人视频数据传输至云端,但伴随而来的数据安全问题日益突出,选择加密是对视频进行隐私保护的有效手段之一.针对目前H.264/AVC视频选择加密方法普遍存在安全性不足的问题,文中提出了一种基于宏块编码信息自适应置换的H.264/AVC视频加密方法.该方法根据宏块的编码类型逐帧自适应生成伪随机序列,利用伪随机序列将宏块编码信息中的残差编码方案(Coded Block Pattern,CBP)和残差数据(Residual)在宏块间进行随机置换,同时还对I宏块的帧内预测模式以及P宏块与B宏块
DPoS(股权授权证明)是当前主流区块链共识机制之一,独特的节点竞选机制使其形成不断演化的区块链社区.对区块链社区演化模式进行分析可以发现共识机制的潜在风险,具有十分重要的研究意义.针对DPoS共识机制区块链数据,提出了一种新颖的共识机制效能组合分析策略,面向区块链社区演化模式,提出了一种多角度探索的可视分析方法.首先,量化了节点排名变化前后工作完成度与投票排名的差异,对共识机制的选择效能和激励效能进行组合分析;然后,针对共识机制组合效能、节点地域分布演化和节点间差异比较等方面设计可视化视图与交互手段;最
表决是现代民主社会常用的一种方式,涉及政治、股份企业、法院判决等多个领域.表决是一种特殊的投票,它只有“同意”和“否决”两个候选对象,一方票数过半即得结果.区块链作为一种自带对账功能的数字记账技术,具有时间戳、公开性、不可篡改等特性,满足表决的透明性和可验证性.为实现表决的匿名性,文中采用环签名来隐藏表决内容与表决者的对应关系.文中提出的分级匿名表决方案,实现了表决的合法性、保密性、不可重复性、可更新性和可验证性.通过为表决者产生虚拟身份形成层级机制,可用于各表决者持票数不等的场景;分级匿名表决协议将门限
纯文本信息隐藏容易遭受删除、更改等主动攻击,使嵌入的秘密信息遭到破坏.区块链因具有不可篡改、不可伪造、匿名性、节点信息同步等特点,成为构建隐蔽信道的天然平台,并确保秘密信息不被破坏.文中提出了一种面向纯文本信息隐藏的区块链隐蔽通信模型.首先,根据偏序关系确定嵌入秘密信息的位置,发送方使用空格法将秘密信息嵌入到纯文本内容中;然后,构建区块链网络隐蔽通信的场景,发送方将载有纯文本内容的交易发布到区块链网络上;最后,在交易打包并形成链块后,任意节点均可作为接收方获取文件,但只有受信方可以通过嵌入算法的逆过程提取
科技的飞速发展为拍摄和分享图像带来了便利,但随着图像数据的急剧增多,泄露和篡改等安全问题也频频发生,图像加密技术的应用迫在眉睫,尤其是彩色图像的加密急需改进与发展.传统的加密技术主要是针对数据流加密,其效率低、计算量大,存在一定的局限性.基于变换域加密将图像从空域变换到频域进行加密再变换到空域,属于一种有损加密.基于混沌的加密,密钥空间大,实现简单,加密速度快,一般需要采用多个混沌系统来增强加密的安全性.为此,文中设计了一种针对彩色图像RGB三通道的简单安全的空域加密算法,先由Logistic-Sine-
区块链是近年来炙手可热的技术话题之一,与其相关的研究理论正在不断丰富.然而,距离区块链技术落地仍面临着吞吐量小、处理效率低的关键问题.针对该问题,跨链技术作为一种有潜力,同时具备扩大吞吐量处理能力、提升处理效率的区块链技术而被广泛关注.文中给出了一种基于改进哈希时间锁的跨链资产交互协议(A Novel Hash-Time-Lock-Contract Based Cross-Chain Token Swap Mechanism,NCASP),创造性地为Fabric区块链引入账户体系,融合智能合约技术实现了在