【摘 要】
:
如今,互联网已经成为人们日常生活的一部分,人们在享受互联网带来的便利的背后离不开推荐系统的帮助。但是随着用户在平台使用时间的增长用户的历史数据也越来越多,与互联网早期需要针对新用户的而着力解决冷启动问题相比,如今如何利用好已有数据来维持现有的成熟用户显得更为重要。针对这一问题,本文首先介绍了传统推荐算法的研究现状及发展趋势,然后详细介绍了目前常用的推荐算法及其改进。成熟用户在平台积累了更多数据更难
论文部分内容阅读
如今,互联网已经成为人们日常生活的一部分,人们在享受互联网带来的便利的背后离不开推荐系统的帮助。但是随着用户在平台使用时间的增长用户的历史数据也越来越多,与互联网早期需要针对新用户的而着力解决冷启动问题相比,如今如何利用好已有数据来维持现有的成熟用户显得更为重要。针对这一问题,本文首先介绍了传统推荐算法的研究现状及发展趋势,然后详细介绍了目前常用的推荐算法及其改进。成熟用户在平台积累了更多数据更难寻找喜好都相似的用户,本文因此选择能够根据用户喜好进行推荐的基于项目的协同过滤推荐算法,但该方法存在着受项目热度、共同评分数量、评分时间等因素影响的问题,同时单一的传统算法并不适用于如今百万级以上的数据,本文针对上述问题对传统的协同过滤算法进行改进和研究,具体工作如下:提出了添加惩罚热门项和时间衰减协同过滤推荐算法(IFFF-ICF),该模型从牛顿冷却公式中得到启发设计了新的时间衰减函数,在对评分按照时间进行衰减的同时减缓了对极端评分的遗忘速率,使其在面对长期数据时能够更加精准的反映用户的真实评价,同时为避免热门项目在计算物品相似性时产生干扰分别对热门项目和用户设计了适合的惩罚项,提高了推荐的准确性。考虑到基于项目的协同过滤推荐算法的准确率非常依赖对于用户喜好物品的判断,而单一的近期评分数据或只考虑评分较高的项目无法准确捕捉到用户兴趣,因此本文利用时间窗口将用户兴趣分为短期兴趣和长期兴趣两个部分,通过综合用户近期行为中的兴趣变化得到的短期兴趣和历史评分中反映的长期兴趣趋势找出用户真实兴趣集。将用户兴趣模型和改进的协同过滤算法想结合最终得到基于用户兴趣模型的添加惩罚热门项和时间衰减的协同过滤算法(IFFF-ICF-Interest算法)。改进后的协同过滤算法面对如今指数级增长的数据量时存在效率不足的问题。因此本文提出了融合矩阵分解的基于项目的协同过滤算法(FMT-ICF)模型作为召回模块,通过充分利用用户以及物品的背景信息降低推荐排序时的比较数量。该模型采用因子分解机进行召回,在面对用户信息这种极度稀疏变量时能充分发现其中的交互信息,同时针对因子分解机无法充分挖掘用户评分矩阵中信息的特点,采用非负矩阵分解的方法提取项目隐特征作为物品的特征变量。融合以上两种算法能够很好的将用户、项目的背景信息和评分信息结合起来,降低协同过滤的项目的计算量,从而更加精准的寻找每位用户真正感兴趣的内容,大幅提高协同过滤算法的效率及准确率。最后本文在Movie Lens 100k数据集上进行了试验并证明了本文提出的算法的有效性。
其他文献
当前,中国正处于全面贯彻落实区域协同发展战略的关键阶段,长三角一体化发展已上升为国家战略,而创新作为一体化发展的内在驱动力,区域创新协调发展的重要性不可忽视。长三角地区是科技创新资源高地,研发要素作为保证创新战略顺利实施、推动创新质量提高的重要战略资源,研发要素的流动能够有效促进区域创新质量趋于收敛,加快统筹区域创新协调发展。鉴于此,研究研发要素流动对创新质量空间收敛的影响有助于长三角区域一体化的
2007年美国发生次贷危机进而引发2008年的全球金融危机,世界各国经济增长受到了严重影响,面临着20世纪30年代经济大萧条以来前所未有的挑战。随着各国纷纷实施积极的财政政策以提振经济,政府支出增加,从而导致政府债务规模逐年上升,2011年欧洲主权债务危机的发生使得世界经济下行的压力进一步增大。世界各主要国家旨在促进经济复苏或者刺激经济增长的大规模扩张性政府支出计划并没有产生决策者事先预期的经济繁
中国自加入WTO以来,进出口贸易迅猛发展,在经济效益明显的背后,也带来了能源资源的过度消耗和生态环境的破坏,如何科学计量出口导致的环境成本,在实现经济增长的同时加强生态环境保护,已经成为决策者亟待解决的现实难题。传统研究在衡量出口贸易隐含污染物时,大都关注CO2和SO2,对其他环境污染物考虑不足,这有可能导致对出口贸易环境成本估算的有偏,进而影响政策制定的科学性和有效性,该方面工作亟待改善。基于此
随着现代化建设的高速发展,高耗能、高污染的问题也接踵而来,为了解决经济发展粗放和区域发展失衡问题,国家大力推进持续发展战略的实践以提高经济发展效率和质量。沿海综合经济区作为我国对外开放的经济重地,对国家经济发展起着举足轻重的作用。对此,提高生态效率是沿海综合经济区贯彻可持续发展理念的必然选择。因此,探究沿海综合经济区区域之间的关联及溢出效应对于沿海综合经济区高质量发展及区域协调发展实践都具有重要意
随着计算机技术的巨大进步,财务文本信息近年来开始受到研究者们的关注。财务文本信息的研究目前主要有文本结构、文本可读性、文本语调等等。年报中的文本信息比如管理层讨论与分析一节中关于公司当前业绩的总结,未来盈余的预测、以及公司未来的战略部署等都可以给以投资者为代表的外部信息使用者提供大量的决策信息。财务文本信息范围也很广泛,不仅仅包括管理层讨论与分析,还有公司公告以及一些其他的会议文本,甚至分析师报告
原油被誉为“黑色黄金”,对国民经济正常运行起着重要作用。当前,全球经济及金融形势发生复杂深刻变化、地缘政治问题频繁发生、新冠疫情复发等因素导致我国原油期货价格波动水平加大,极端风险溢出概率随之增加。原油是能化产品的基础原料之一,作为能化产业链的上层驱动器,油价波动会通过产业链传导对中下游的能化期货市场产生冲击,这将影响我国能源衍生品市场乃至原油化工行业持续健康发展。上海原油期货于2018年3月26
长江经济带连接我国东部与西部,具有独特的地理优势和巨大的发展潜力,是全国重要的经济走廊,已成为支撑我国战略的综合实力最强的区域之一,人力资本和产业结构是长江经济带经济增长的重要驱动力。现有研究表明,人力资本水平和产业结构优化存在着双向的互动关系,且存在区域差异。如果人力资源和产业结构优化二者协调,会对社会经济良性发展产生关键作用。本文基于2006-2019年106个长江经济带地级市面板数据,建立P
我国经济已由高速增长阶段转向高质量发展阶段,新动能是推动高质量发展的重要力量。长江经济带是推动我国形成优势互补高质量发展的先行区域,也是培育新动能、引领转型发展的创新驱动带。本文针对长江经济带区域,对其经济新动能发展水平进行测度分析,充分了解其发展状况以及区域差异,进一步定量分析影响长江经济带经济新动能发展的因素。这对于促进长江经济带经济新动能的发展具有重要意义。本文首先基于新动能的内涵,并综合相
公路交通基础设施发展与农村发展一直是我国社会发展的重点,而二者之间的关系却鲜少有学者深入研究。自空间计量模型推广以来,学者们通过实证认为交通基础设施对经济增长、缩小城乡收入差距是存在显著的空间溢出效应,对经济集聚与产业集聚存在门限效应。然而,由于研究对象、研究方法的差别,对于空间溢出产生的方向及大小并未统一结论。因此,本文通过深入分析安徽省各地级市公路交通对农村发展的空间溢出效应和门限效应,对现阶
经济规模的扩大,带来了自然资源的高度消耗,人类的生存环境面临威胁,转而制约了经济发展。过去粗放的经济发展模式不再适用于新时代。自党的十六大提出全面协调可持续发展战略开始,生态建设与保护逐渐提上了我国的重要工作日程。长江经济带作为推动我国经济社会高质量发展的排头兵,必须贯彻落实新发展理念,将生态建设与经济建设有机统一起来。在知识经济时代,经济发展更关注以人为本,人力资本对经济增长的贡献也逐渐提高,在