基于用户情景模糊聚类的协同推荐研究及应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yongtso88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和电子商务的蓬勃发展,大量的数据资源充斥在网络之中,人们不得不花费较长的时间选择自己喜欢的资源。个性化推荐系统的出现较好地解决了这一问题,成为当今越来越受关注的研究领域。目前,一些新的推荐方法和推荐技术相继出现。比较常用的推荐算法有基于关联规则的推荐算法、基于内容的推荐算法、协同过滤推荐算法以及混合推荐算法。  协同过滤推荐技术是个性化推荐系统中应用最广泛且最成熟的推荐技术。它通过分析用户的历史行为数据找出目标用户(或项目)的最近邻居集,进而参考邻居集合的喜好来预测目标用户的喜好,实现推荐。但其仍存在许多问题需要解决,主要有数据稀疏性、冷启动和算法扩展性差的问题。此外,还有新用户以及情景缺失等问题。  对此,本文提出一种基于用户情景模糊聚类的协同推荐算法。该算法综合考虑了用户评分信息和用户情景信息这两个因素对推荐的影响,主要工作有三点。  第一点,将聚类技术应用于协同过滤推荐系统中,提出了一种基于用户情景模糊聚类的协同过滤推荐技术。第二点,提出了一种传统的协同过滤中用户相似性度量的改进算法。第三点,提出根据用户间的综合相似性寻找目标用户的最近邻居。对于第一点,首先根据用户情景信息利用模糊聚类算法对用户进行聚类,将情景信息相似的用户放入同一个聚类中。下一步的协同过滤是在具有相似情景的用户群中进行的,具有相似属性的人更容易产生相似的兴趣爱好;同时,最近邻居是在目标用户所属的小的聚类中生成的,降低了计算所需的矩阵的维数,提高了算法的可扩展性。对于第二点,在计算用户相似度时,先利用Slope One算法对稀疏矩阵中的评分缺失项目进行预测填充,再在新矩阵上进行计算,有效改善了数据稀疏性问题,提高了邻居用户选取的准确性。对于第三点,综合考虑了用户情景信息及用户评分信息对推荐的影响,将用户主观评分相似性与用户客观情景信息相似性以一定的权重结合起来得到用户间的综合相似性,使得没有进行过任何评价的新用户也能得到推荐。  本文在MovieLens数据集上采用平均绝对偏差(MAE)和平均相对偏差绝对值(MAPE)两种度量标准验证了本文提出的算法。实验结果表明,本文算法较传统的协同过滤推荐算法以及个性化服务中基于模糊聚类的协同过滤推荐算法在推荐精度上有一定的提高。最后,通过一个实际的项目说明本文算法在实际中的应用。
其他文献
随着自然语言处理从单文本内部转向多文本之间,作为文本间实体链接的纽带,跨文本指代消解越来越凸显其重要性。与传统的面向信息检索的跨文本指代消解不同,信息抽取中的跨文本指
随着信息技术的飞速发展,二维条码逐渐渗透到我们生活的各个方面。通过扫描二维条码获取信息已成为我们日常生活消费中重要的便捷方式。其中二维条码PDF417目前应用最为广泛,已
无线传感器网络(Wireless Sensor Network,简称WSN)是自组织的分布式网络系统,由一种微型传感器构成,这种传感器具有无线通信能力与计算能力,它可以根据具体环境在无人操作的
在现代社会中,电能已经是一种最为广泛运用的能源形式。然而,随着现代电子技术的广泛应用,电力系统存在着大量非线性、冲击性和波动性负荷,造成电能质量严重降低。另一方面基于计
随着OCR技术的不断发展以及印刷体字符识别技术的不断完善,人们对识别的要求也越来越高。商场购物小票,它是消费者购物时由商场或其它商业机构给用户留存的销售凭据。一张小小
低压电力线载波通信(Low-voltage Power Line Communication,LVPLC)能够利用普及的电力线网络,在传输电力的同时,可以承载数据、语音和视频等信息,大量应用于远程路灯监控、
REST即Representational State Transfer(表述性状态转移)是一种真正体现Web自身的软件架构风格,是理解Web自身的关键所在,REST架构本身体现出的设计思想也正是HTTP1.1协议的
智能电网的智能性是建立在海量的,关键的,敏感的电网运行信息上的,这就需要强大的数据处理、分析和存储能力。这些海量数据的处理和存储对传统的服务器和关系型数据库来说是一个
在节能减排,建设智慧、绿色城市的大背景下,加大燃气,特别是天然气的在能源消费结构中的比重,已成为上海市能源政策的重点。上海的主要燃气分为液化石油气、煤气和天然气。随着城
21世纪是人类深海探测和开发的时代,大深度潜水器作为实现人类开发深海的重要技术手段,其重要性越来越凸显。为了适应深海工作需要,对大深度潜水器的材料性能要求而相应提高