校园用户行为与轨迹的匿名化研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:linxunchang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,特别是大数据技术的发展使得对海量用户数据的处理成为可能,从数据中泄露用户隐私的问题现如今也非常严重。在校园生活中学生和教师也会产生各种各样的数据,如去食堂吃饭刷卡、去图书馆借阅书籍、连接网络通上网等。使用这些数据可以产生许多个性化的服务,为他们的校园生活带来更多的便利,但是这些数据的公开不可避免地也存在隐私泄露的问题。本文在现有匿名化方法的基础上,提出基于集合划分的方法对用户数据进行匿名化保护,并在校园数据上进行实验,在攻击者能力很强的时候,也可以有效地保护校园用户的隐私。本文的主要工作有:·对用户具有稳定习惯的行为进行匿名化。通过使用一阶马尔科夫链对用户的行为习惯进行建模,将用户可能出现的行为划分为不相交的几个子集,在行为集合较大时使用语义树按照类别划分行为。使用用户的真实行为所在的集合作为匿名化的结果。最后在校园刷卡数据上进行实验,并与MaskIt系统中的模拟检查方法做对比。·对用户动态轨迹进行匿名化。将集合划分的方法与轨迹匿名化中的虚假地点方法结合起来,对于需要向服务器发送地点信息的应用,通过发送多个地点来保护隐私。动态指的是用户可以到达的地点集合并不是固定不变的,使用用户的历史轨迹数据,以及地点的流行程度来预测用户可能到达的地点。提出启发式的算法对于可以到达的地点集合进行划分,并向服务器发送包含真实地点的地点集合。最后在校园无线网接入数据上进行实验,实验表明该算法划分的效果并不差。·对攻击者去匿名化能力的研究。对于由许多用户构成的数据集,其中数据集中可以识别出用户的敏感信息已经被删除,而攻击者仍然可以通过其他的附加信息从数据集中识别出用户,并得到用户的所有信息。在本文所使用的刷卡数据和无线网接入数据上,通过实验计算攻击者需要了解多少用户的记录才可以从数据集中唯一匹配出用户。然后在对个人数据进行匿名化后的数据上进行实验,观察使用本文匿名化方法对于攻击者的影响。
其他文献
随着网络和网络技术的发展,全球互联网规模的日益扩大,网民数量的大量增加,人们在越来越依赖网络的同时,大规模的网络攻击和病毒扩散也日趋频繁。如何保障网络与信息系统的安
面向服务架构(SOA)已被广大企业所接受,为其提供有效的IT解决方案,使企业能够对市场做出快速反应。现有的SOA平台多是以Web服务为基础,建立在企业服务总线(ESB)上的一种技术
近几年来,长江中下游河道采砂一直处于难于管理状态。长江中下游河道范围广,江砂被盗采的地点多,采砂监管和执法队伍人员不足,有相当数量的非法采砂事件难以发现和处理。对非
合作型多智能体决策技术研究给定的一组智能体如何协调彼此的动作,与环境进行交互,共同完成一个长远的目标。合作型多智能体决策技术有相当多的应用背景。例如,机器人足球队,球员
随着云计算、物联网和移动互联网的快速发展,大数据正成为信息技术的新热点,产业发展的新方向,对人类的生产与生活产生巨大影响。大数据来源于互联网、企业系统和物联网等信
图的连通支配问题是近几年来图论中的一个比较活跃的研究领域。图的连通支配问题的研究不仅具有很重要的理论意义,而且在优化理论、通讯网络设计与分析、网络搜索、模式识别等
随着互联网的普及,人们的工作、学习和生活与网络联系越来越紧密,在实际生活中出现了各种各样的网络。IP地址是互联网中的基础资源,但缺少有效的管理方法。传统DHCP只能实现
随着计算机技术的迅速发展,许多工作需要靠计算机按照一定的执行规则自动实现,特别是企业业务流程的自动化或半自动化实现。工作流管理系统为实现这一目标提供了新的技术手段
目前,疲劳驾驶在车辆肇事中占了相当大的一部分。疲劳往往容易引起瞌睡,但是许多疲劳的驾驶员却常常不知道自己已经处在瞌睡的危险状态之中,因此需要设计一种瞌睡监测的方法
无线传感器网络被认为是未来改变世界的十大技术之首,但有限的计算、存储和通信能力,尤其是严重受限的能量使其应用前景面临巨大挑战,无线传感器网络在应用之前需要解决很多