基于多维标签与分类排序的推荐算法研究及实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lwl45789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是目前热门的研究方向之一,其涉及了信息检索,数据挖掘,机器学习,复杂网络以及社会学等不同研究领域。虽然目前推荐系统得到了长足的发展,但仍然面对着冷启动,稀疏性,可扩展性等问题。随着推荐系统的数据越来越完善和丰富,为了能够得到更好的推荐效果,推荐系统会把多种数据源信息融入到推荐算法中。标签信息就是其中一种重要数据信息,本文以此作为切入点进行研究。在评分预测场景中,为了提高推荐算法的评分预测能力,缓解冷启动和稀疏性问题,本文提出了多维标签融入基于近邻和基于矩阵分解的协同过滤的方法。该方法根据标签之间的联系对标签进行了组合,丰富了标签信息,并结合用户标签和物品标签信息,组成多维标签信息。在近邻协同过滤中,本文利用用户-多维标签矩阵计算用户相似度,利用物品-多维标签矩阵计算物品相似度,并使用线性加权的方法把多维标签相似度与协同过滤的评分相似度混合,最后进行评分预测。基于矩阵分解的协同过滤是目前流行的推荐算法,隐式反馈矩阵分解能够利用隐式反馈数据增强推荐效果,本文将多维标签信息作为一种隐式反馈数据,将用户-多维标签矩阵转化为二元反馈矩阵,融入到矩阵分解中。Top-N推荐就是给用户推荐其感兴趣的项目列表。对于该场景,本文基于排序学习的思想,提出基于分类排序的推荐方法。该方法应用混合推荐的瀑布式框架,在协同过滤的推荐结果基础上,利用逻辑回归分类模型解决Top-N推荐列表的排序问题。逻辑回归模型对用户对物品是否感兴趣进行分类并利用输出分值对Top-N推荐列表进行排序,其中模型使用了多维标签信息作为输入特征,同时利用了流行的在线算法FTRL(Follow the Regularized Leader)进行优化,解决算法的可扩展性问题。实验表明本文提出的基于多维标签信息协同过滤,有效地提高了推荐算法的评分预测效果,能够在一定程度上缓解推荐算法的冷启动和稀疏性问题。此外,对于TopN推荐,本文提出的基于分类排序的方法,能够提高Top-N推荐列表的推荐效果。
其他文献
新时代背景下,工匠精神的内涵日益丰富,敬业乐业、勤奋专注、精益求精、突破创新是工匠精神的内涵。工匠精神是从业者的职业价值取向和行为表现,引领社会发展的风向标,关乎到
随着我国经济的不断发展和生态环境问题的日益严重,我国生态环境建设的重要性日渐突出,特别是可持续发展战略提出以来,生态环境建设越来越受到人们的重视。园林工程在我国生
研究目的本研究旨在确立护理人员与愤怒患者沟通的核心技能和规范流程;寻求不同的方式培训护生与愤怒患者沟通的技能,制作FLASH多媒体动画演示平台并验证其培训效果。研究方法
我国56个民族,由于地理环境和历史的不同,保留有丰富多彩的不同风俗习惯.沉淀着他们与大自然搏击的古老文化,悠悠的历史和相互间的融合和影响,记录着他们对其传统文化的扬弃
目的探讨术前服用不同剂量和时间的米非司酮(RU486)对术后腹壁切口子宫内膜异位症(AIEM)异位病灶CD16、CD32、CD64的影响及意义。方法将40例AIEM患者分为:对照组(未服RU486,1
锌是与骨骼肌损伤和修复密切相关的微量元素,参与肌肉损伤后的炎症、氧化应激反应、肌细胞增殖分化等过程,而锌转运体ZIPs则是调节机体内锌的分布、存储、利用的重要媒介之一
小豆生育期短,耐瘠、耐阴,适应性广,是我国主要的食用豆类作物之一,也是我国重要的出口农产品和优势农产品,其总产量和出口量均居世界第一位。连作障碍是制约小豆产品质量和产量的
蹴鞠是中国古代最受广大人民群众喜爱的运动,蹴鞠是及健身、娱乐为一体的一项运动,蹴鞠运动是一项团队合作的运动,队员现代学生具有广泛的价值,如果把蹴鞠假如校园体育,可以使学生
作为全国最大的原料生产基地,黑龙江省亚麻种植和原料加工历史悠久,具有明显的优势。但是,由于种种主客观原因,目前黑龙江省亚麻原料生产中存在着种植技术严重滞后、原料供给
目的:考察亲子冲突、归属感和累赘感对青少年自杀意愿的影响关系,为青少年的心理健康教育管理提供依据。方法:采用亲子冲突量表,归属感量表,累赘感量表和自杀意愿量表,从5个