结合用户属性与自然最近邻的个性化推荐算法的研究

来源 :重庆师范大学 | 被引量 : 0次 | 上传用户:cailing12530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统或推荐引擎(Recommender System)作为信息时代一种有效解决互联网信息过载(Information overload)问题和向用户进行推荐的有效手段,其基本原理是通过分析用户历史行为数据和其他信息提取出用户的兴趣偏好,帮助用户快速寻找满足其需求和兴趣的物品或信息。目前推荐系统已被实际应用到多个领域,如Amazon商品推荐、Pandora音乐推荐、Netflix视频推荐、Google Reader个性化阅读、Facebook好友推荐、Sina新闻推荐等等。目前,主流的推荐方法包含协同过滤推荐(Collaborative Filtering Recommendation)、基于内容的推荐(Content-based Recommendation)以及混合推荐(Hybrid Recommendation)。为弥补单一推荐算法存在的各种不足,如单一的协同过滤推荐算法存在的冷启动问题,单一的基于内容推荐的用户或物品内容信息很难提取的问题等等,通常会将两种以上算法混合起来形成一种新的混合推荐算法以扬长避短。本文首先分析了课题研究背景、简述了国内外研究现状,阐明了个性化推荐算法的产生、发展、应用领域、研究热点及存在的问题。其次,分别对比和分析了目前几种主流推荐算法及推荐算法中常用的聚类方法,在此基础上提出一种基于用户属性与自然最近邻的个性化推荐算法(User Attributes and User-centric Natural Nearest Neighbor-Based Personalized Recommendation Algorithm,UA3NR),具体工作如下:1)鉴于传统的基于K近邻的协同过滤推荐算法在选择近邻时没有充分利用对称邻居信息且参数K(近邻个数)很难确定,本文提出一种基于用户自然最近邻的推荐算法(User-centric Natural Nearest Neighbor-based Recommendation Algorithm,3NR),该算法融入了用户自然最近邻的概念,通过无参数、自适应地基于用户-项目历史评分数据寻找目标用户的自然最近邻用户并进行推荐,进一步提高推荐的准确度。在使用3NR算法对目标用户进行推荐时,又提出“活跃用户”概念,即在目标用户近邻集合中增加了对评分预测有积极意义的活跃用户,可有效缓解数据稀疏性对推荐结果的不良影响。2)由于3NR算法不能有效应对冷启动问题,本文又提出一种基于用户属性聚类的推荐方法(User-clustering-based Recommendation Algorithm,UCR),首先通过用户属性进行聚类,找到目标用户所属类别和目标用户的邻居集合,再根据邻居集合预测评分并向目标用户推荐物品。UCR是一种局部的近邻查询方法,一定程度上可以降低算法复杂度,进而提高推荐效率,且使用用户基本属性信息聚类可以一定程度缓解用户冷启动问题。3)最后将3NR和UCR算法加权混合得到本文UA3NR算法,在保证推荐准确度和提高推荐算法的效率的前提下,也一定程度上缓解数据稀疏性问题和用户冷启动问题。4)通过MovieLens真实数据集设计一系列仿真实验,对本文算法进行验证。实验结果表明本文提出的基于用户自然最近邻的推荐算法(3NR)相比K-CF算法和INS-CF算法[75]的RMSE(root-mean-square error)和MAE(mean absolute error)值更小,本文的UA3NR算法在聚类个数为5-15时MAE值始终小于NPSSC[71]算法。
其他文献
随着无线通信技术的快速发展,无线传感器网络(WSN)得到了国内外学者越来越多的关注。而节点定位技术作为其主要支撑技术,已经成为WSN的研究热点之一。由于利用静态锚节点的定位
图像获取和存储技术、以及互联网技术的发展,使社会生活中的各个领域都积累了大量的历史车牌图像和实时车牌图像,这些数据大部分是自然场景下自动获取的,呈现获取场景不受限
随着农业科学技术的发展与种植结构的调整,设施化农业得到了前所未有的发展,温室作为设施化农业的典型代表,改变了传统农业的生产模式,打破了植物生长的地域和时空限制,提高
随着电子技术的快速成长,身份认证技术至关重要。掌纹识别技术,作为一种新兴的生物特征识别技术。相对其它的,具有难以伪装,比较稳定、不具侵犯性以及难以隐藏和非接触等特性
随着互联网技术的发展,Web成为各种应用与研究的重要数据源之一,为信息检索、数据挖掘等领域提供高质量的数据。Web中一类重要的数据保存在可搜索网络数据库中,只有通过提交查询
近几年来随着RFID技术的成熟和发展,RFID作为物联网关键支撑技术,在物联网上的应用越来越广泛,随着数据信息处理能力的提高,智能物件之间的距离和位置信息越来越受到重视。RF
随着网络电话、网络电视、视频直播等为代表的高带宽消耗的多媒体应用在日常生活中爆炸性的增长,无线接入网络的速率也需要大幅的提升。以光纤网络和无线接入网络技术融合而
随着硬件水平的不断提升,目前电子游戏的音效和视觉效果都得到了较明显的提高和改善。但游戏人工智能的研究和应用却相对不完善,从而造成游戏中非玩家角色(NPC)的行动显得单
近年来,我国互联网行业发展迅速。原来只存在于现实世界的许多事物被不断地搬上互联网,比如电子商务、网络社交、互联网金融等。人们的生活已经越来越离不开互联网,其已经成
随着计算机技术、微电子技术、通信技术的发展,工业控制技术发展迅速,传统的加热设备控制系统的信息化技术对高处理能力、实时多任务、网络通信和超低功耗的要求越来越高。本课