【摘 要】
:
结合强化学习(特别是深度强化学习)的推荐算法,在近年来相比已有方法取得了较大的提升.然而,现有绝大多数基于深度强化学习的推荐方法仅使用循环神经网络(RNN)等方法学习用户
【机 构】
:
清华大学计算机系北京信息科学与技术国家研究中心,北京100084
论文部分内容阅读
结合强化学习(特别是深度强化学习)的推荐算法,在近年来相比已有方法取得了较大的提升.然而,现有绝大多数基于深度强化学习的推荐方法仅使用循环神经网络(RNN)等方法学习用户的短期兴趣,忽略了用户的长期兴趣,导致对用户的兴趣建模存在不足.因此,该文提出一种结合用户长期兴趣与短期兴趣的深度强化学习推荐方法(LSRL).首先,LSRL方法使用协同过滤方法来学习用户的长期兴趣;其次,LSRL方法利用门控循环单元(GRU)对用户最近的正反馈与负反馈交互记录进行建模学习,得到用户的短期兴趣表示;最后,LSRL方法重新设计了深度强化学习的Q-网络框架,结合两方面的用户兴趣表示并将其应用于深度Q-网络(Deep Q-Network)中,预测用户对物品的反馈.在MovieLens数据集上的实验结果表明,该文提出的推荐方法比其他基线方法在归一化折损累计增益(NDCG)与命中率(Hit Ratio)上有显著提升.
其他文献
从建筑工程造价预算控制的重要性、控制的关键点和控制的对策三方面进行了一一的说明与阐述,说明了预算控制的重要性和意义,在预算控制当中所出现的原材料问题、人员问题等方面进行了细致的分析,抓住了关键点与要点,并针对前面的要点,制定出与之相对应的方法。
近年来建筑市场逐渐呈现下滑状态,工程项目的付款情况也不尽如人意,部分建筑施工企业维持经营步步维艰,若想进一步在市场竞争中有所发展更是难上加难。不但要通过取得业主信任和认可而树立品牌,还需要通过企业内部改革创新实现降本增效。如何高效完成这些工作,需要企业给予项目管理和经营方面强有力的支持,从一名建筑公司经营层经营管理人员的角度对从在建项目的完成、安全控制、狠抓工程质量提升,市场营销、紧盯市场发展涉足新兴产业方面进行分析,希望为对工程行业经营人员提供参考与借鉴。
近年来涉及旧城区的道路改造工程在城建中明显增多,但人行道的建设却多作为形象工程一带而过,未能彻底解决人行道存在的问题,比如绿化、无障碍设施、行人舒适度等。我们通过对南宁市东盟商务区人行道改造工程为例,归纳总结现状人行道基本情况和存在问题,并提出改造对策,以期为有效提升老旧城区人行道品质提供新的思路。
幽默是人类独有的品质,在日常交际中发挥着重要作用.随着人工智能的快速发展,如何让计算机识别幽默成了自然语言处理研究领域的热门研究内容之一.该文针对幽默的自动识别问题
随着我国经济和科学技术的快速发展,我国城市化进程也逐渐加快,我国建筑行业的发展进行得如火如荼,人们生活水平的不断提高使得人们对房屋建筑的要求也不断提高,所以我们要做好房屋建设的质量和安全管理工作。为此就房屋建设过程中容易出现的质量和安全问题展开论述,并提出了具体的控制措施.
当前我国正处于市场经济转型的关键时期,在这种全新时代背景的促使之下,新型土木工程中建筑工程的整体规模也在不断拓展与延伸,在这基础之上完成对土木工程建筑造价管理的有效优化,是加强我国土木工程整个行业得以进一步改革与发展的必要手段。因此就土木工程建筑工程造价管理的有效价值及新时期造价管理过程当中出现的问题进行全面有效分析,并给出提升土木工程造价管理价值的具体措施,以做参考。
对建设项目管理和质量管理的现状进行了详细的分析和系统设计,提出了改进建设项目管理和质量管理水平的方法。
在方面级情感分类中,常用的方法是用卷积神经网络或循环神经网络提取特征,利用注意力权重获取序列中不同词汇的重要程度.但此类方法未能很好地利用文本的句法信息,导致模型不
当前的电子病历实体关系抽取方法存在两个问题:忽视了位置向量噪声和语义表示匮乏.该文提出一种基于位置降噪和丰富语义的实体关系抽取模型.模型首先利用位置信息和专业领域
老旧小区改造是惠民利民的重要民生工程。针对老旧小区改造过程中存在的片面化、粗略化、阶段化等问题,提出设计先行,综合改造;保留特色,有机更新;尊重民愿,居民参与;引入物业,长效管理的改良策略。