协同过滤推荐算法研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:jiejie2717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的到来,人们渐渐从信息接收者转变为信息创造者,信息分享也变得更加容易,人们在享受着互联网带来的便利的同时,也逐渐被信息过载问题所困扰。面对浩瀚的、令人眼花缭乱的信息,人们很难快速有效的找到自己的需求,甚至出现信息迷航问题。因此,推荐系统应运而生,用来满足人们个性化的需求。它首先收集用户行为信息,分析用户偏好,向用户提供推荐。在推荐系统技术中,协同过滤技术由于其简单有效的特点,被广泛的使用,并取得了较好的效果。但随着推荐系统规模的不断增长,协同过滤技术也面临着一系列的挑战,尤其是数据稀疏性问题和可扩展性问题。论文主要围绕这两个挑战展开研究。  1.针对数据稀疏性问题,提出了基于混合相似度的用户协同过滤算法HSUCF。在计算相似度时考虑共同评分项目数目所占的权重,并给出了该权重因子的定义,实现了对相似度计算的修正,实验结果表明本文提出的HSUCF算法能够提高推荐精确度。  2.针对可扩展性问题,提出了优化的基于用户聚类的协同过滤算法OUKCF。在协同过滤中加入用户聚类可以减少目标用户近邻搜索空间,而且聚类可以离线计算,提高了算法效率,能够满足推荐系统实时性要求。但传统的基于用户聚类的协同过滤算法对推荐精度改进不明显,甚至会有所降低。本文在进行用户聚类计算时,引用前面提到的混合相似度,实验结果表明,本文提出的OUKCF算法也能够提高推荐精确度。
其他文献
随着互联网技术的飞速发展以及云存储技术的不断完善,大规模数据的处理机制也发生了巨大的变化。面对在互联网应用中每天产生的大规模数据,本中心提出了面向双边资源整合服务模
在对计算机模拟MBR研究中,发现由于膜在空间上仅占据整个系统的很小一部分,造成了模拟中对膜过程实际现象进行充分、深入表达的需求与计算量限制之间的矛盾,从而导致“仿而不真
随着电生理仿真规模的大幅增加并随之而来的数据量的剧增,人们越来越需要一个能够实时可视化并且能够在计算过程中进行干预控制的电生理仿真系统。如何完成这样一个电生理仿真
风能,作为可再生能源,无穷无尽,清洁环保,已成为许多国家可持续发展战略的一个重要组成部分,因此,风力发电得到了迅速的发展。风电机组工作环境恶劣,长期受到正常和极端温度、降雨、积雪、沙尘、太阳辐射等环境因素的影响,各部件也必将不可避免随着运行时间的变化而老化,可靠性下降,导致故障发生,影响风电场的安全稳定。风力发电机作为风电机组故障率较高的部件,对其进行实时状态监测,及时发现故障征兆,确定合理的维护
人脸识别作为一种典型的生物特征鉴别方式,已经成为模式识别领域中一个重要的研究方向,具有广阔的应用前景。近年来移动互联网的迅速发展对人脸识别的应用也随之产生了新的需求
随着计算机互联网技术的发展,实时数据流成为数据信息中一种重要的数据形式,且已被广泛应用于网络流量控制、数据监测系统、互联网金融等领域。如何快速有效的从高速、大量的
目前,随着手机普及率的提高,加之社交网站、购物网站的普遍应用,手机注册的普遍性,用户手机号已成为商家广为利用的营销工具。随之而来的垃圾短信,不仅占用网络资源,干扰用户
分布式信源编码(Distributed Source Coding, DSC)主要研究多个信源的独立编码和联合解码。它的理论基础是Slepian-Wolf理论和Wyner-Ziv理论。分布式视频编码(Distributed Vi
智能电网的快速发展,使智能电表、量测系统等应用增加,从而使数据的规模和种类呈直线式增长,海量电网数据的安全存储问题成为制约智能电网发展的瓶颈。云存储技术可以使用虚拟化技术把物理资源整合成统一的存储资源,支持海量数据的存储,其具有数据处理量大、灵活性强和高可靠性等优点,可以解决海量电网数据的存储问题。但是使用云存储电网海量数据时,如何保证电网数据存储的完整性是智能电网云存储系统发展过程中面临的挑战,
无线射频识别RFID(Radio Frequency Identification)技术是一种非接触式自动识别技术,利用射频信号通过传递消息来实现识别。随着RFID技术的不断发展,安全和隐私问题受到人们越