基于分组裁剪的差分隐私模型推荐

来源 :汕头大学 | 被引量 : 0次 | 上传用户:dyc56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务平台中广泛应用的协同过滤推荐技术是根据相似用户的偏好数据向目标用户推荐项目,虽然其具有无需理解项目内容、易于实现等优点,但却很难保护用户的隐私信息,使得从中收集高质量数据变成了难以实现的任务,进而影响了推荐的准确率。近年来,基于数据失真的差分隐私保护因其对攻击模型的严格定义和对隐私泄露风险的定量化的表示和证明而受到了极大的关注。  论文通过研究隐私保护中的差分隐私和协同过滤中的矩阵分解技术,提出将差分隐私保护引入user-item评分矩阵,采用隐语义模型矩阵分解方法实现推荐。论文主要工作:为了减少噪声的加入量,提出了自适应用户分组裁剪方法,以对原始评分矩阵中对项目评分比较少的用户进行裁剪处理,然后将差分隐私引入未被裁剪的用户中,以对评分矩阵添加Laplace噪声来实现隐私保护,并对差分隐私处理后的原始评分矩阵进行隐语义模型分解,利用随机梯度下降算法优化得到user-factor矩阵和item-factor矩阵,最终实现推荐。通过在Movielens数据集上进行相关实验验证,表明文中提出的基于分组裁剪的差分隐私模型推荐算法GCDPR不仅可以有效的保护用户的隐私信息,同时也能获得良好的推荐准确率。
其他文献
跨语言信息检索(CLIR)是用户采用一种语言的查询检索另一种语言的文档集合的过程。查询翻译是CLIR系统中采用最广泛的方法。查询翻译普遍采用基于词典的方法,而查询中的未登录词
在数据采集和处理中,存在着大量的概率数据,这些数据具有复杂的相关性以及在查询和处理方面具有实时性。而目前的传统关系数据模型都是用来处理确定数据的,这就需要研究支持
聚类分析是数据挖掘中一个重要的研究分支,已在多个领域得到了很好的应用,诸如模式识别,数据分析和图像处理等。随着实际应用中数据的大量产生,数据的属性类型不再是单一类型为主
潜在语义分析(LatentSemanticAnalysis,LSA)是一种通过统计分析挖掘出文档和词语之间潜在含义的经典算法,最初用于解决信息检索中的多义词问题。潜在语义分析使用传统的向量空
传统的节点由电池供电的无线传感器网络,存在着因节点电池耗竭而无法正常工作这一弊端。能量捕获传感器网络(Energy-Harvesting Wireless Sensor Network,EH-WSN)克服了这一弊端
迁移工作流是近年来工作流管理的一个新的技术,它将工作流管理和移动计算结合起来,特别适用于需要传递大量数据和需要大量远程过程调用的处理过程。迁移工作流管理系统包括迁
过去的三十多年来,无论是在商用领域还是个人家用领域,基于Intelx86[7]架构的服务器和个人主机都具有很高的市场份额[8]。不过近些年来,随着消费者对智能手机和平板电脑等移
决策树作为数据挖掘领域最为广泛使用的技术之,由于其在知识获取以及知识表达方面的突出优势而备受青睐。伴随着海量数据的产生,数据中蕴含的不确定知识同时日益增长,因此人
Ad Hoc网络是由一组带有无线收发装置和移动终端组成的一个多跳的临时性自治系统。然而,由于Ad Hoc网络无中心管理和网络拓扑结构的动态性等特点,如何在网络拓扑结构不断变化的
学位