面向商品推荐的差分隐私保护算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hutianyi199052
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据规模的增长和网络商品经济的发展,推荐算法的重要性不言而喻。推荐算法旨在利用数据挖掘等技术为用户提供个性化推荐。在具体的商品推荐中需要利用用户对商品的反馈,这其中不可避免地存在着泄露用户隐私的风险。差分隐私具有高隐私性特点,已成为隐私保护领域的一个通用标准。本文就其中两个具体的问题,研究了面向商品推荐的差分隐私保护算法。其一,针对频繁项集挖掘的隐私保护研究。商品推荐过程中,历史消费数据充足时,为了发现商品-商品之间潜在的联系,推荐系统往往需要挖掘频繁项集,这一过程需要保护用户对商品的历史消费和评价等隐私信息。为此,本文研究了在保护差分隐私的要求下,高维数据集中挖掘频繁项集的问题,并提出了PrivBUD-Wise算法。与传统算法会导致额外的信息损失不同,PrivBUD-Wise算法不对原始数据集做任何改动,通过合理分配隐私预算来提高算法效用。为了实现这一目标,本文提出了一个新的差分隐私保护机制:SRNM机制,并对其作了严格的数学证明。另外,PrivBUD-Wise算法率先提出一种有偏隐私预算分配策略,更充分地利用频繁项集挖掘问题的特点,在数据效用和时间效率上取得了改进。本文通过三个真实数据集上的对比实验,验证了 PrivBUD-Wise算法相对于现有算法的有效性。其二,针对多臂老虎机的隐私保护研究。商品推荐过程中,历史消费数据不足时,新用户或新物品的推荐基于多臂老虎机的强化学习算法,这一过程需要保护用户对所推荐商品的反馈等隐私信息。本文就此基于现实应用场景,在带侧面观察的随机性多臂老虎机问题的基础上,提出了考虑侧面收益的情况,并给出了后悔值上界得到保证的UCB-Side算法。在融入差分隐私保护机制时,本文首先基于传统的隐私保护技术提出了 DP-UCB-Side算法,最后基于其提出了改进方案:DP-UCB-INT-Side算法。本文通过大量的对比实验验证了 UCB-Side算法和DP-UCB-INT-Side算法的高效用性。
其他文献
为研究一些要素对大学生诚信考试问题中主体行为演化的影响,借助演化博弈理论这一前沿研究工具,建立了监考教师与考生交互过程的演化模型,研究了各种情形下监考教师和学生行
在我国河流仍受到污染,中央努力防治河流污染的大背景之下,本文围绕我国中央层面出台的一系列针对河流污染防治的政策,展开了量化分析研究。本文发现了政策演变的趋势、发文主体及其联合情况的特征、政策目标的侧重、政策工具的选择与不足,这对开展河流污染防治工作具有一定帮助。本文共筛选出64份与河流污染防治密切相关的中央层面政策文献作为样本,在参考已有研究的基础之上,采用政策内容量化研究分析方法,构建“时间—主
本文报告多层螺旋CT多平面重组(Multi-pla-nar reformation,MPR)成像在面神经管的临床应用,以期为面神经管成像提供经验和方法技巧.
在夜间行车安全中,普遍存在汽车前灯所引起的眩目问题,它是酿成车祸的主要原因之一,受到公路交通管理部门的高度重视,因此,人们对各种防眩技术的研究一直也没有停止过。偏振
皮质下动脉硬化性脑病(SAE)是一种老年性脑血管病,又称Binswanger病,是进行性皮质下血管性脑病,是以慢性高血压、脑深部小动脉硬化、皮质下脑白质变性以及多发性腔隙性脑梗死和痴
女,24岁,反复咳血2年,每逢月经期出现,血量多少不等,约20~40ml,为鲜红色。查体:值月经期,体温36.7℃,血压120/75mmHg,各系统检查未见阳性体征。月经史:135/28,生育史:产一子,健康。自然流产1次
针对给水厂含铝排泥水无处理直接排到城市污水管道而进入城市污水厂的问题,进行了给水厂含铝排泥水对污水厂A^2/O工艺运行影响的试验研究。结果表明,含铝排泥水促进了污水厂COD
研究背景血管钙化(VascularCalcification,VC)是动脉粥样硬化、糖尿病及慢性肾病等重大疾病的重要并发症,是危害人类健康疾病的独立危险因子。目前的研究显示,动脉钙化是一种
基于超星"学习通"移动云平台构建《染整工艺实验》线上线下混合式教学模式,并对其进行了初步应用。应用结果表明,"学习通"所具有的"任务""作业""统计"和"讨论"等功能为课程教