论文部分内容阅读
随着移动网络和电子商务的飞速发展,推荐系统在我们的日常生活中起着日益重要的作用。推荐系统可以缓解用户面临的信息过载问题,帮助用户做出决策。而与传统的仅仅基于用户个人的历史评分给出预测结果的推荐系统相比,近年来,伴随着网络社交规模的不断扩大,许多推荐系统也开始使用这些用户之间的社交信息作为补充信息来对推荐算法进行优化,这些推荐系统也被称为社会化推荐系统。社会化推荐系统是对用户行为进行了更真实的模拟,并且有利于缓解用户冷启动和评分数据稀疏问题。然而,随着近几年法律法规的完善与公民隐私意识的提高,个人、企业和政府纷纷越来越重视用户数据的隐私问题。而推荐系统由于使用到大量的用户数据,也不可避免地涉及到用户数据的隐私问题。对于推荐系统而言,解决推荐系统中用户数据的隐私问题不仅仅是对用户隐私的保护,也有利于服务商在服务质量、用户忠诚度方面的利益增长。然而现有的社会化推荐系统对用户隐私的保护尚不完善,这容易导致用户出于保护个人隐私的目的,不愿意提供个人评分、甚至刻意给出不真实评分,最终也影响推荐系统的表现。本课题的研究便是基于上述背景,主要的研究内容分为两部分:第一部分,对于现有的社会化推荐系统中存在的隐私问题,我们提出了一个差分隐私的社会化推荐系统。在该算法中,我们指出了社会化推荐算法面临的隐私问题、对攻击者的假设以及整个差分隐私的社会化推荐系统在隐私性和准确性上目标,然后以广泛使用的三种基于矩阵分解技术的社会化推荐算法为基础,结合合适的差分隐私机制,从而降低社会化推荐系统中的隐私预算,提高对用户数据的保护强度。并通过在两个真实数据集上的实验评估,对比已有的方案,验证了本算法在保护用户评分数据的同时,仍能较好地保留推荐系统评分预测的准确性。第二部分,当推荐系统拥有更加充足的用户数据时,作出的预测结果通常也会更加准确,而实际生活中同一用户的各类数据可能分布在不同的数据方,同时各个数据方出于利益和法规的原因,不能直接交换各自拥有的原始用户数据,而需要通过使用纵向切分下的推荐算法协作获得推荐系统更优的表现,即便如此,和第一部分数据中心化下的推荐系统一样,也避免不了用户评分数据的隐私问题,因此,我们提出了数据纵向切分下的差分隐私的社会化推荐系统。我们基于当下联邦推荐算法的理念,并针对联邦推荐架构中梯度聚合的问题,引入多方安全计算技术取代已有方案中参数服务器的功能,减少了推荐系统对可信服务器的依赖性,从而实现在数据纵向切分情况下对社会化推荐系统中用户评分数据的隐私保护。最后通过实验测试,并与其余算法对比,验证了本算法的有效性。