【摘 要】
:
当前时代背景下,人工智能技术推动智慧医疗进程持续发展,大数据在给医疗行业带来价值和便捷的同时,也蕴含着隐私泄露的风险和挑战。近年来,使用深度学习算法分析非结构化数据的图神经网络模型备受关注,它所展现出的强大表示能力使其在一些医学任务中表现出卓越的性能。然而,在使用医学数据训练图模型时,本地图节点难免会因携带患者个人的真实敏感信息而造成隐私泄露。因此,面向医学数据的图模型隐私保护研究尤为重要。作为隐
论文部分内容阅读
当前时代背景下,人工智能技术推动智慧医疗进程持续发展,大数据在给医疗行业带来价值和便捷的同时,也蕴含着隐私泄露的风险和挑战。近年来,使用深度学习算法分析非结构化数据的图神经网络模型备受关注,它所展现出的强大表示能力使其在一些医学任务中表现出卓越的性能。然而,在使用医学数据训练图模型时,本地图节点难免会因携带患者个人的真实敏感信息而造成隐私泄露。因此,面向医学数据的图模型隐私保护研究尤为重要。作为隐私计算的一种关键技术,差分隐私能够为两个不同输入值的输出分配相似概率,从而混淆敌手基于背景知识的隐私推测,在数学上保证不泄露用户个人隐私,同时依然可以从对加噪数据的训练分析中得到有价值的统计结果。本文重点围绕数据发布和数据挖掘阶段所面临的医疗诊断数据隐私泄露问题,提出两种基于差分隐私的解决方案,主要研究内容和贡献总结如下:(1)扩展了差分隐私的应用领域,首次实现了对医疗诊断任务中非结构化的处方数据进行差分隐私保护。首先基于笔者已录用期刊论文,调研、分析和总结了差分隐私在大数据隐私保护生命周期中的应用现状和实现机制,并针对具有差分隐私应用需求的数据发布和数据挖掘阶段,依次提出基于差分隐私的直方图发布方案和基于本地差分隐私图神经网络的医疗诊断方案,以降低在分析或共享生物医学数据时,图节点携带患者敏感信息的概率。(2)针对在医疗诊断统计记录发布时,传统的直方图发布算法容易造成患者诊断记录隐私泄露的问题,本文使用一种直观的基于差分隐私的直方图发布算法进行实验,以此对比了在不同隐私预算下直方图统计数据的分布状态和总误差,实验结果较为直观地展示了隐私预算和数据可用性之间的关系。(3)针对服务器端模型在分析医疗诊断处方数据进行患者病理分类时可能通过图节点收集用户敏感信息而造成的节点隐私问题,一方面,考虑患者病史、病理和首诊处方信息,根据现实中避免误诊需求,研究构建医疗诊断处方图数据的方法。另一方面,使用本地差分隐私图模型在五个真实图数据集上进行图节点分类实验,重点研究具有节点级别本地差分隐私保护的图神经网络医疗诊断方案。实验结果表明,本地差分隐私图模型对特征扰动和标签扰动均具有鲁棒性。对于用于医疗诊断的首诊处方数据集而言,即使适当降低特征或标签的隐私预算,其精度损失仍然可以控制在10%以内。此外,在使用带噪特征和标签进行训练和验证后,模型在测试集中的表现效果依然优于交叉熵或前向校正法。因此,对于本研究中的医疗诊断病理分类任务,本地差分隐私图神经网络模型可以在敏感数据的隐私保护程度和模型准确率之间取得权衡。
其他文献
随着信息技术的飞速发展,传统的单机计算已经不足以支撑巨大业务规模,分布式计算成为解决单机瓶颈的解决方案。RPC(Remote Procedure Call,远程过程调用)框架提供简洁强大的编程模型,成为构建分布式计算的基本组件。然而由于云计算的发展,现有IT基础设施正在从专有网络向云计算进行迁移,传统的以数据中心内部和外部为划分的安全边界被打破,传统RPC框架在使用时很可能面临如下问题:1)RPC
互联网众筹是落实普惠金融的一种重要手段。在国家大力提倡“大众创业、万众创新”的时代背景下,众筹已然成为“双创”的有力助推器,为开启更好的创业时代贡献力量。但众筹的税收监管制度尚未完善,自身运作模式还不成熟,相关的政策法规仍不健全。在现有金融环境下完善互联网众筹税收征管制度,是规范互联网众筹健康发展的重要一步,是经济发展的必然要求,也是税收体系的与时俱进。本文研究内容一共分五部分。第一,在“大众创业
随着科学技术的不断提高,网络经济的快速发展,数据暗藏的巨大潜力与财富暴漏在大众眼中,信息处理者更热衷于非法获取并处理个人信息。在劳动用工领域,网络技术的发展使传统的监控方式转变为数字化监控,用人单位利用先进的监控手段与设备对工作场所中的劳动者进行数字化监控已然成为一种普遍的现象,并且劳动者个人信息权益受到侵犯的程度越发严重。随着《中华人民共和国民法典》(以下简称民法典)的出台,个人信息保护问题受到
区块链是一种分布式基础架构与计算方式,能够保证数据传输和访问的安全。共识机制作为区块链的关键技术之一,能够保证分散节点对数据达成共识。随着量子计算机的发展,依赖于经典加密算法的区块链容易被破解,安全性受到了威胁。因此,许多学者考虑将量子信息技术引入到区块链与共识协议中。然而,提出的量子区块链大多只是在经典区块链中采用了一些量子通信协议,区块链的数据结构和实施方案本质上仍沿用经典设计,提出的量子拜占
三农问题一直以来都受到我国政府的紧密关注,而作为我国粮食生产的重要一环,我国的粮食储备系统一直以来都面临着欠缺效率的问题。近年来,为了优化粮食生产,提升产业整体效率,国务院推动实施了国家级政策“五优联动”。该政策旨在通过鼓励优良优产来优化粮食生产全流程链,从而提升整体的经济效益。而在整个“五优联动”的实施中,浙江湖州作为试点地区的“空仓招标”政策有望为优化粮食储备系统做出示范性贡献。然而,尽管该政
随着我国经济发展步入新常态,城市建设也开始迈入品质提升新阶段,以人群活动为表征的空间活力成为衡量城市空间品质的重要因素。地铁站域作为城市中人流聚集的重要公共空间节点,和人们的日常出行以及各类活动的开展密切相关,构建高品质、多样化、充满活力的站域空间是促进城市可持续发展的必然要求。近年来,长沙市城市建设和地铁建设迅速发展,长沙地铁正处于与城市空间不断适应、融合的阶段。本文选取长沙市地铁1~5号线共计
种质资源为战略性资源,种质资源平台能够有效解决种质数据的信息孤岛问题,实现资源共享。在种质资源领域内,传统的种质资源身份认证平台仅通过单一服务器进行认证,容易导致数据泄露或者丢失,在认证过程中用户和平台也面临着更多潜在的安全问题,如:中间人攻击问题、重放攻击问题和拒绝服务攻击问题。针对传统的种质资源平台所面临的上述安全性问题,本文提出了一种基于区块链和人脸识别技术的身份认证机制,该机制融合了区块链
概念史是历史语义研究的著名范式,尤其是德国概念史模式享誉世界,备受推崇和借鉴。概念史方法在逐渐国际化的过程中,也在不断适应不同地域历史文化的研究取向,同时越来越显现出解决悬而未决的理论问题的迫切性。在中国新近的概念史实践中,量化分析较为常见。倘若忽视概念史方法的要领,很可能发现不了相关历史"真相"。另外值得关注的是概念史与新文化史的关系,二者有着不同的问题意识和追求。最后,概念之国际传输中的翻译困
2021年11月1日《中华人民共和国个人信息保护法》正式施行,为个人信息权益保护奠定了法律保障。智能终端操作系统作为连通终端用户与第三方的基础,是《个人信息保护法》的重点关注对象,同时也是捍卫用户隐私安全的关键角色。而其隐私政策文本则是保护个人隐私的重要关口,操作系统通过隐私文本与用户共同协商和管理着隐私关注边界。本研究将隐私关注边界理论作为分析框架,在研究方法上首先通过LDA建模分析,提取隐私政
随着信息时代的互联网技术的飞速发展,软件项目在开发过程中面临多种风险因素,这些不利的风险因素决定了软件项目的成功,软件项目风险管理的研究变得越发重要。X公司的多租户平台项目基于PaaS的多租户技术,该项目纳管多种大数据组件,为不同的租户提供不同的服务。此外,该项目系统架构较为复杂,涉及数据量繁杂,技术难点较多,进度要求较高等特点。论文基于国内外项目管理领域的研究现状及项目风险管理的理论和方法的基础