一种基于用户兴趣值和期望值的改进协同过滤算法

来源 :湖南大学 | 被引量 : 0次 | 上传用户:nj_wpp1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在海量数据环境中,个性化推荐系统成为了帮助用户发现自己感兴趣的物品或信息的利器,在很大程度上节约了用户在寻找物品或信息时的时间和精力。另一方面,随着数据量的飞速增长,传统协同过滤算法作为当下最成功的推荐算法之一,正面经受着用户评分矩阵稀疏性问题所造成的严峻影响。本文主要对推荐系统面临的推荐准确性问题进行了深入的分析和研究,在基于用户协同过滤算法(User-Based Collaborative Filtering,下文简写为UBCF)的基础上,利用用户兴趣这一属性对用户相似度算法进行了改进,并对传统尺最近邻算法(K-Nearest Neighbor,下文简写为KNN)进行了简单优化,将两者融合提出了一种改进的协同过滤算法。本文首先阐述了个性化推荐策略国内外的发展现状,并对几种常见的推荐策略进行了分析,比较了各自优缺点,着重介绍了基于用户协同过滤算法。然后分析了协同过滤推荐算法的关键——用户相似性算法,选取了其中在基于用户协同过滤算法中效果最佳的皮尔逊算法进行进一步分析,发现其中存在对于用户兴趣未充分利用以及同一用户不同项目类别之间评分尺度不一致问题。本文通过引入用户兴趣值以及期望值这两个概念,从而提出了一种基于用户兴趣值和期望值的改进用户相似度算法。接下来,通过对传统尺最近邻算法进行分析,发现由于数据稀疏性过大,为目标用户选择了最近邻用户集合后,在对目标项目进行预测评分阶段可能会出现只有极少数甚至没有用户对目标项目进行过评分的情况,这将对推荐质量造成不良影响。基于此点,本文提出了一种经过简单改进后的KNN算法。而后,将改进的用户相似度算法和改进的KNN算法进行融合,提出一种改进的协同过滤算法。并通过实验得到最合适的调和参数,基于此调和参数,设计了一系列合理的实验对该算法的有效性进行验证。实验结果表明,本文提出的改进协同过滤算法能在很大程度上提高用户相似度的准确率,并得到较好的推荐效果。最后对本文所提出的改进算法进行了实现,设计了一个推荐列表可视化工具。
其他文献
作为信息安全领域相互对抗的两种技术,信息隐藏与隐写分析技术在互联网信息安全的急切需求中快速地发展了起来。借助于图像进行信息隐藏可以解决多种互联网信息安全性问题,例
RFID技术是一种非接触的自动识别技术,具有高效、可靠、识别距离远、多点识别等优点,已经被广泛应用到商业物流和交通管理等领域。但是当多个电子标签同时对阅读器的寻呼做出
信息技术发展的今天,任何企业的发展都离不开信息技术,企业信息化建设的地位在企业的发展过程中越来越重要。而企业的信息化建设从根本上来讲无非就是管理决策上的信息化,业
随着网络技术高速发展和移动通信技术的不断成长,移动设备成为人们生活中一个重要组成部分,如:手机、IPad、电子钥匙等,给人们的生活带来巨大的便捷,人们可以随时随地的进行
光器件在硅基衬底上的集成是目前光电集成领域的研究热点。采用传统的拾取/放置装配方式对光功能微元件进行集成容易受粘结效应的影响。自组装技术具有的非接触特点能够很好
各大高校的学生在专业课程的学习过程中都需要做大量的实验,现有的用于实验教学的方法通常是在实验室中操作真实的实验设备,这种方法存在着不方便、不经济、危险性大等缺点,
由于视频监控系统能够为社会安全管理、执法监管以及人们的日常生产生活提供丰富而有用的信息,所以得到了广泛的应用。然而视频监控系统的摄像采集设备无时无刻地采集监控数
茶叶是贵州省第三大重要的经济作物之一,是农村重要的收入来源。近些年来,贵州茶叶种植面积快速增大,种植面积排名全国第一。形成了都匀毛尖、湄潭翠芽、绿宝石、遵义红、雷山清明茶、普安红等著名黔茶品牌深受茶客青睐。茶叶在推动贵州农业经济发展中做出了巨大贡献。因此,从生态地球化学角度,探明贵州久安碎屑岩、雷山变质岩分布区茶园岩石土壤元素地球化学特征,摸清茶叶品质差异性及分析控制茶叶品质的主要地质因素,对贵州
随着互联网的发展,信息井喷式的增长以及网络的迅速普及,搜索引擎和个性化推荐系统成为人们获取信息最流行的两个工具。然而当部分信息难以简单描述或用户难以精确描述自己的
随着传感器技术的发展,多传感器图像数据类型和数量急剧丰富,图像融合技术在军事、遥感、计算机视觉、医学图像处理等领域得到了广泛应用,更成为了国内外研究的热点。近年来,