【摘 要】
:
随着大数据时代的蓬勃发展,相关社会机构可以获取大量数据,这些数据创造了巨大的商业价值和科研价值,但又常涉及到个人隐私,直接对其进行分析研究会造成隐私泄露。因此,大数据应用发展所面临的一大挑战就是隐私保护。差分隐私是一种新型的隐私保护技术,现已被广泛应用到各个领域中,其中在差分隐私下对线性回归模型的研究受到广泛关注。但当数据具有异常值时,线性回归模型将不再适用,而分位数回归模型不仅弥补了线性回归模型
论文部分内容阅读
随着大数据时代的蓬勃发展,相关社会机构可以获取大量数据,这些数据创造了巨大的商业价值和科研价值,但又常涉及到个人隐私,直接对其进行分析研究会造成隐私泄露。因此,大数据应用发展所面临的一大挑战就是隐私保护。差分隐私是一种新型的隐私保护技术,现已被广泛应用到各个领域中,其中在差分隐私下对线性回归模型的研究受到广泛关注。但当数据具有异常值时,线性回归模型将不再适用,而分位数回归模型不仅弥补了线性回归模型在数据具有异常值时的不足,而且可以更加全面地描述被解释变量的全貌,因而分位数回归模型被广泛应用于经济、医疗、教育等领域中,但现有的分位数回归建模没有考虑隐私保护的问题。因此,本文研究差分隐私下分位数回归模型的估计问题具有一定的理论意义和实际应用价值。基于差分隐私下经验风险最小化方法,本文研究了光滑近似分位数回归模型的估计问题。具体为,在拉普拉斯机制下提出了既能有效保护数据隐私又能保证参数估计精度的三种差分隐私算法,分别为:输出扰动、目标函数扰动和梯度扰动。同时,通过数值分析验证了算法的有效性,得到如下结论:目标函数扰动和梯度扰动的估计都能在隐私保护程度较高时接近非隐私保护下的估计精度;在相同的隐私保护程度下,目标函数扰动估计精度最高,但当样本量较大时,梯度扰动的估计精度接近于目标函数扰动的估计精度,且计算速度更快。
其他文献
套利资本、市场流动性以及债券定价误差三者之间相互联系:较大的债券价格波动是套利资本短缺的主要表现之一,而套利资本短缺又会导致市场流动性降低。依据这一研究思路,本文首先运用无套利宏观金融模型对银行间国债价格进行建模,研究债券定价误差中所包含的有关流动性变化的信息。在此基础上,本文在无套利宏观金融模型中引入流动性因子,对银行间国债的价格进行拟合,从而提取流动性因子,估计不同期限国债的流动性溢价。本文首
现有研究表明,罕见变异与复杂疾病或性状密切相关,因此发展罕见变异多位点关联研究的加权方法对复杂性状或疾病机理的探究具有非常重要的意义。本论文针对现有的多位点联合分析方法在使用范围受限和功效偏低等问题,发展了具有更好适用性和更高功效的罕见变异多位点统计推断方法,具体研究了以下内容:首先,本论文在原有Beta加权法的基础上从四个方面对聚集柯西关联检验(ACAT)的加权方法进行探究,包括基于外部数据的P
在诸多临床试验和医学跟踪研究中,人们所搜集到的纵向数据往往会存在缺失的情况,这将导致模型参数的估计出现较大偏差,因此必须对纵向缺失数据进行处理,以此来提高数据分析的质量。在对缺失数据处理的过程中,根据纵向数据缺失原因的不同,本文将纵向缺失数据分为间歇性缺失和退出性缺失两大类缺失数据进行讨论研究;本文假设了纵向响应变量与观测时间点具有非线性关系,对随机效应基于一种半参数方法对其先验分布建模,采用线性