基于模范用户的协同过滤算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:caozheng853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务大行其道的时代,人们需要的不再是简单的信息提供,而是有针对性的信息推荐。众多个性化推荐技术中协同过滤可谓一枝独秀,该算法引领了当今各大电子商务平台的推荐系统的发展趋势。但随着电子商务行业规模不断发展壮大,无论是用户还是商品的数量呈现指数级增长,同时用户对电子商务推荐所提供服务的要求也越来越高。协同过滤技术在面对当前的挑战时暴露出许多有待解决的瓶颈问题。针对存在的这些问题,国内外的研究机构和学者不断地探索改进方案。本文深入分析比较了协同过滤算法及当前主要的改进算法。提出基于模范用户的协同过滤算法。模范用户的概念类似于现实生活中的劳动模范或标兵。在某个领域或行业起到模范带头作用,也是其他人效仿和学习的榜样。将这样一个概念引入到协同过滤推荐算法中,主要目的是希望建立一个有较好稳定性的模范用户模型,该模型中的用户能反映其所在的一个或多个领域内用户的兴趣爱好,协同模范用户推荐出的商品应该是准确和可信赖的。该模型的建立对于缓解协同过滤技术中存在的稀疏性问题、推荐的实时性问题有很大的帮助。同时稳定的模范用户模型也可以应对电子商务平台快速增长的用户和商品数量的挑战。本文通过对用户-项目评价矩阵中的用户聚类,在每个类中生成一个模范用户评分向量。模范用户并不是聚类的中心,而是按照一定的生成规则生成的虚拟用户。该组用户增大了类内用户的评分密度,反映了类内用户整体评价趋势。聚类技术通常必须指定一个聚类个数,这样给出的聚类结果是否合理,是否真正反映了用户群的分类就需要进行聚类有效性的验证。本文通过DB指标对普通C均值聚类算法的聚类效果进行验证,当DB指标取到极小值时聚类迭代结束,获得最优聚类粒度;通过分割系数PC对模糊C均值聚类进行有效性验证,当聚类自适应函数值取到极大值时获得最优聚类粒度。对于两种聚类算法均实现了自适应聚类粒度的确定。实验表明:聚类数自适应算法可以取得有效性验证指标的局部最优值,既最优聚类效果。对在此基础上生成的模范用户模型应用协同过滤推荐算法,目标用户在线推荐的效率有很大的提高,模范用户模型相对稳定,推荐精度也有所改善。
其他文献
随着人们生活水平的不断提高,糖尿病患者的数量也随之增长,给人类健康造成了极大的危害,而糖尿病患者临床治疗的主要目的是稳定血糖,假如能够提前预测出患者的未来血糖浓度,
随着Web数据量的不断增长,分布式数据的集成和共享变得越来越困难。本文提出了一种基于本体环境迁移(OCI)的分布式数据集成方法。同传统的集成方法相比,该方法能减少实现复杂
随着计算机技术的迅猛发展,计算机网络已经成为人们日常生活中的重要组成部分。而伴随而来的计算机安全问题也日益突出,传统的防火墙、身份验证等技术应经不能满足现阶段的技
随着互联网和搜索引擎技术的发展普及,人们对于如何在庞大的互联网上高效地获得有价值的信息日益关注。文档自动摘要技术作为人们挑战信息爆炸式增长与信息有效利用之间矛盾
随着信息技术的飞速发展,光网络技术也在不断地进行着变革,于是出现了越来越多的接入网技术,给“最后一公里”的接入问题提供了诸多解决方案。而在这些解决方案中,波分复用无
文件资源是计算系统最主要的资源之一,现有Windows操作系统对文件资源的使用都是以用户为主体,访问控制大都采用自主访问控制的方式,对文件的加密只支持NTFS文件系统,这样的设计
学位
快速二维码(quick response code,QR code)最早由日本Denso Wave公司发明并被用于跟踪汽车零件,它具有可靠性高、信息密度大、识别速度快、抗干扰性好、占用空间小等优势。它
大数据时代的今天,怎样从海量的信息中精确的检索到满足需求的信息成为当前信息检索领域的首要任务。语义信息检索是语义网技术和信息检索结合紧密的研究领域,旨在提供一种高
推荐系统是一种非常有效的信息过滤技术,可帮助用户从浩瀚的数据海洋发现其感兴趣的信息。自2006年10月Netflix公司组织推荐算法竞赛以来,矩阵分解推荐模型因具有较低的时间
粗糙集是一个处理不确定性和含糊问题的数学工具,由于它不需要先验知识或附加信息,因此在数据挖掘和知识约简等方面都有很好的应用前景。作为粗糙集理论的核心内容,属性约简