【摘 要】
:
随着信息技术的蓬勃发展,互联网向经济社会各个领域渗透,各大社交网站使人们的信息获取方式和生活方式产生了极大的改变,同时各种信息系统存储并积累了海量的社交数据,随之而来的是个人隐私信息安全问题日益突出。大数据是当今时代的一座“大金矿”,数据开放共享是分析和挖掘“大金矿”的关键所在,为防止个体隐私信息在数据分析或挖掘过程中遭受泄露威胁,因此亟需寻求一种有效的隐私保护机制及隐私度量方法为数据发布者在保证
论文部分内容阅读
随着信息技术的蓬勃发展,互联网向经济社会各个领域渗透,各大社交网站使人们的信息获取方式和生活方式产生了极大的改变,同时各种信息系统存储并积累了海量的社交数据,随之而来的是个人隐私信息安全问题日益突出。大数据是当今时代的一座“大金矿”,数据开放共享是分析和挖掘“大金矿”的关键所在,为防止个体隐私信息在数据分析或挖掘过程中遭受泄露威胁,因此亟需寻求一种有效的隐私保护机制及隐私度量方法为数据发布者在保证数据隐私制定安全决策提供依据。结构熵能在含有噪声的网络结构数据中解码出的真实结构信息,有效解决了社交网络中的隐私度量问题,结合最大背景知识假设的差分隐私保护技术,本文以信息熵度量模型、结构信息论和差分隐私理论为隐私保护工具,旨在解决社交网络数据开放共享中存在的隐私量化和隐私保护问题。具体研究工作如下:(1)基于差分隐私的权重社交网络隐私保护。针对权重社交关系的隐私保护问题,本文基于非交互式差分隐私保护模型提出社交网络边权重直方图统计发布方法。首先,结合非交互式差分隐私保护模型和经典信息熵度量模型,利用一维结构熵度量出社交网络中所隐藏的信息量,进一步进行隐私泄露量度量。其次,对社交关系设计Laplace噪声随机扰动算法,将边权重直方图统计作为查询结果,构建非交互式查询模型。最后,为减少随机的噪声量,提出随机扰动改进算法,该算法引入社区结构熵将社交网络划分为若干子社区,从社区层面注入Laplace噪声,使各个社区序列满足差分隐私,实现社交关系差分隐私保护的直方图统计发布。(2)融合图结构熵和差分隐私的社交网络隐私保护。由于权重社交网络的复杂性和噪声随机性,在差分隐私中引入结构信息论,提出了基于图结构熵的社交网络差分隐私保护算法。首先,利用社区结构熵和随机噪声设计一种指数机制,在社区划分的过程中注入随机噪声,通过指数噪声扰动待合并社区的候选项。其次,为了减小误差,构造社区间最小化剩余结构熵的“有权虚介边”添加策略和Laplace噪声混淆社区内部边关系策略。最后,在真实社交网络下的仿真实验表明,本算法在保证社交网络差分隐私保护的同时,能够保留较高的数据效用。
其他文献
移动支付拥有强大的便捷性和融合性,对我国居民的消费行为有着重要影响.本文以移动支付为切入点,通过构建BayesQR模型和SUR模型,分别探索其对居民家庭消费总量及消费结构的影响,本文的主要工作分为三大部分:第一部分是相关的理论分析及数据准备.首先,从理论上分析居民消费的影响因素及移动支付对居民消费的影响路径,为模型的变量选择及结果分析提供依据;其次,对西南财经大学中国家庭金融调查与研究中心最新公布
磁共振扩散成像(diffusion magnetic resonance imaging,d MRI)是当前唯一一种可以无创检测活体生物组织内水分子扩散信息的技术,活体组织中的水分子受神经、细胞及周围组织结构影响进行受限扩散,其扩散位移分布可以反映组织的微观结构。为了从d MRI信号中准确地估计出水分子的扩散位移分布,高角度分辨率扩散成像(high angular resolution diffu
联邦学习是以数据不出本地为前提的分布式机器学习隐私保护框架,各参与方利用私有数据训练本地模型,通过聚合模型参数的方式协同构建联邦模型,从而实现数据的可用不可见。然而在聚合各本地模型参数时存在两个问题:一是模型参数聚合时易导致参与方隐私泄露;二是聚合权重通常按数据量进行加权分配,不利于激励拥有数据量少但质量高的参与方,从而存在聚合权重分配不公平问题。针对联邦学习中模型参数聚合的隐私泄露和公平性问题,
耳鸣是在无外界刺激情况下,患者自觉耳内或颅内有声音的一种主观感觉。本病的病因、病机复杂,已为五官科的难治病之一。目前,中医治疗耳鸣多从肾论治,从其他脏腑角度论治则较少,然而中医认为耳鸣的发生与身体各脏腑皆有一定联系,故诊治耳鸣可从多脏腑进行分析。李梴的《医学入门》阐释了一种新的脏腑之间的关系,即脏腑别通,认为心与胆相通,肝与大肠相通,脾与小肠相通,肺与膀胱相通,肾与三焦相通。这种新的关系对于临床诊
自世纪年代以来,投资组合优化问题一直是实际金融市场上的一个重要研究内容,它涉及不同资产之间的最优配置.Markowitz在1952年首先提出量化金融的观点并建立了均值-方差模型,该模型将投资收益和风险分别量化为期望和方差.近年来,基于均值-方差模型的投资组合优化研究已成为投资组合领域的热点问题之一.面对全球金融危机以及新型冠状病毒疫情等不确定突发事件带来的一系列影响,研究者们发现在复杂多变的金融市
ROC曲线和曲面方法是现代诊断医学统计学的热门研究内容.针对诊断实验中有三种或三种以上诊断结果的情形,我们常采用ROC曲面来代替ROC曲线进行方法准确度的判断.回顾以往有关ROC曲面估计问题的文献,可以发现学者们大多使用的是参数方法和非参数方法,而利用半参数方法的研究很少.本文结合连续比例逻辑斯蒂回归模型和bootstrap方法研究了在一个半参数密度比模型下进行的ROC曲面估计,基于Reaven,
在强化学习中,环境模型是对环境的动力学建模,能够对智能体执行的动作做出反应,对未来状态和奖励进行预测。把环境模型作为一种工具在强化学习中使用,其中一种主要的应用方式是利用环境模型生成模拟样本,进行策略规划。这一类使用环境模型进行策略规划的方法统称为基于模型的强化学习。虽然基于模型的强化学习能有效提高强化学习的样本效率,但是存在计算资源消耗大,对模型预测准确性要求高等问题。因此,研究付出更少代价,获
共识机制在区块链应用中起到极其关键的作用,直接关系到系统的性能和安全。DPo S共识机制以高效率、低能耗等优点在共识算法领域占有一席之地,同时,DPo S因其中心化程度高、安全性低与投票不积极等问题备受争议。安全多方计算在数据隐私保护与联合计算方面具有得天独厚的优势,这与共识机制在某些方面不谋而和。利用安全多方计算生成可信随机数为共识机制提供随机性与公平性成为新的解决思路,将安全多方计算及其密码技
命名实体识别是自然语言处理中的基础性任务之一。由于自然语言的特性,文本中存在大量嵌套命名实体。传统方法使用序列标注方法识别命名实体,无法识别嵌套结构的实体。针对嵌套命名实体识别,相关研究提出了基于跨度和超图等模型。这些方法能解决嵌套实体识别问题,但存在不能充分感知实体边界、无法编码实体边界和上下文的语义依赖特征等问题。基于认知神经科学中控制注意力的思想,本文提出了基于控制注意力的嵌套命名实体识别方
随着网络信息化发展速度的不断提高,学习方式及资源呈现方式不断转变,当今大学生对打印、复印的需求量变大,包括打印(或复印)试卷、实践报告书、简历、身份证等。经营一家校园打印店,可以解决学生的需求,获得可观的利润。文章以西安翻译学院东西两个校区的三家打印店为例,通过对这三家店的调查研究,进行全方位、全领域系统分析,最终得出了经营校园打印店的可行性,以供参考。