论文部分内容阅读
随着移动互联网技术的迅猛发展和智能移动设备如雨后春笋般的大量普及,智能手机,智能个人数字助理(Personal Digital Assistants,PDAs),智能车载导航系统等基于移动互联网通讯的移动智能设备已经成为当今社会人们生活的必需品。移动智能设备重量轻,体积小,使用者能够在日常生活和工作中随身携带它们,在该过程中大量的用户个人实时位置数据被收集。移动应用服务商利用移动智能设备实时获取的用户位置数据,推出了大量基于位置数据的应用服务(Location Based Services,LBSs),如高德地图,美团外卖,陌陌交友等。这些LBSs极大地便捷了人们的日常生活,并且成为了移动应用市场中的明星产品。除此之外,在学术研究方面,挖掘大量位置数据有利于对人类行为学的研究,甚至为全球性难题提供解决方案,如控制新冠病毒疫情的蔓延等。然而,由于用户的位置数据中包含了大量的隐私信息,如家庭地址,工作单位,甚至健康情况和宗教信仰,因此直接暴露用户的位置数据必然会引起潜在的隐私泄露问题,增加社会的不稳定因素,从而降低用户使用基于位置服务的欲望,阻碍大数据时代的发展。本文着眼于移动互联网下的位置数据隐私保护问题,分别面向位置数据采集权限,发布数据的可用程度,发布数据的隐私保护程度和隐私保护过程中的数据传输效率四个方面进行研究,针对移动互联网下基于位置数据的应用在数据传输过程中所存在的隐私泄露问题,提出了四种位置数据隐私保护方法,主要内容如下:(1)针对目前基于位置的应用获取采集用户位置数据权限的方式比较单一,易于被恶意用户攻击的问题,提出了一种结合用户呼吸频率的用户认证方法,增强个人用户授予采集位置数据权限过程的隐私保护强度。该方法利用移动智能设备的前置摄像头传感器采集用户的人脸图像,并根据图像获取用户的呼吸频率,认证用户身份。同时,该方法结合压缩感知理论,降低了数据采集频率,缓解了移动智能设备计算能力有限的问题。除此之外,本方法还提出了一种训练稀疏字典的方法将压缩后的数据恢复至正常频率,保证计算呼吸频率的准确性。最后,通过仿真实验,验证了算法的可行性,有效性。(2)针对位置数据隐私保护过程中,过度重视保护数据中的隐私信息,而忽略量化所发布数据可用性的问题,提出了一种基于最小略图数据结构的位置数据隐私保护方法。本方法引入最小略图统计原始位置数据中不同位置所出现的频率,从而获得人口密度分布数据。由于最小略图结构在统计元素频率过程中存在假阳性的特点,本方法输出的人口密度分布数据与真实数据存在差别,从而实现了隐私保护的目的。同时,本方法提出了计算所发布的人口密度数据与真实数据之间的差别概率公式,利用该公式可以量化所发布数据的可用性,在实际应用中,可以通过调整参数数值来满足不同的可用性需求。最后通过仿真实验,验证了算法的可行性,有效性。(3)针对位置数据隐私保护方法所发布数据的隐私保护程度与可用程度关联过强的问题,提出了一种基于差分隐私的位置数据隐私保护方法。该方法首先将原始位置数据储存在最小略图结构中,然后引入差分隐私概念中的拉普拉斯机制,将噪声数据添加在略图中,使得该结构满足-差分隐私,最终发布由差分隐私的最小略图所统计的人口密度分布数据,从而实现对位置数据进行隐私保护的目的。该方法从最小略图和拉普拉斯机制两个方面对位置数据进行隐私保护,削弱了所发布数据的可用程度与隐私保护程度之间的强关联性。该方法可以通过调整拉普拉斯机制中的隐私保护参数,实现满足不同隐私保护程度需求的目的。最后通过与其他当下比较流行的隐私保护方法的对比仿真实验,验证了算法的可行性,有效性。(4)针对位置数据隐私保护过程中,由于移动智能设备计算能力和能源有限,导致数据传输效率较低的问题,提出了一种基于差分隐私的双略图的位置数据隐私保护方法。在基于最小略图的位置数据隐私保护方法中,略图的大小对所发布数据的可用程度具有直接影响,因此无法通过减小略图尺寸,减小数据量,实现提高数据传输效率的目的。在本方法中,引入了相互协作的双略图,即全局略图和临时略图,临时略图不用于数据传输的目的,因此可以设置较大的尺寸来保证数据的可用程度,在临时略图保证数据可用性的情况下,将原始数据集成在尺寸较小的全局略图中,继而同时实现了减小略图尺寸,提高数据传输效率和保障所发布数据可用性的目的。同时,该方法在全局略图的传输过程中,引入拉普拉斯机制,使传输的数据满足差分隐私,为位置数据提供了双重隐私保护。最后,本方法与其他位置数据隐私保护方法的对比仿真实验结果表明,在所发布数据的可用程度一致的前提下,本方法可以降低数据传输量,提高数据传输效率,验证了本方法的可行性和有效性。