保护隐私的多标记分类方法

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:woyaoguo_sanji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习是机器学习的一个重要研究领域,在近些年得到广泛关注。在多标记学习中,每一个训练样本都被赋予由一组类别标记组成的标记子集来表示其多种语义信息,而学习的任务为给未分类的样本预测出其所有相关的类别标记。值得关注的是,现有的多标记学习算法都只是从机器学习的角度出发,在训练分类模型时,直接利用训练数据集的真实特征信息;在对未分类样本进行分类时,直接将未分类样本提交给分类模型进行分类。因此,这些方案只适用于训练数据集的拥有者自己训练出分类模型,再用模型来给自己的未分类样本分类。然而这样的应用场景是十分有限的。假如训练数据集的拥有者和未分类样本的拥有者是互不信任的两方,则现有的多标记学习方案都会产生隐私信息泄漏的问题。因此,如何能在对样本进行分类的同时保护数据的隐私信息,成为迫切需要研究的方向。本文对此进行研究,主要工作如下:(1)研究了保护隐私的多标记学习问题。本文将加法同态加密和安全点积协议相结合,运用在客户-服务器模型下的多标记分类中,提出了一个保护隐私的多标记分类方法。该方法使得客户和服务器在分类过程中均不能获得任何有关对方的有价值的隐私信息。证明了该方法的安全性,分析了该方法的计算和通信复杂度,模拟实验评估了方法的效率。(2)为了减小用户在分类过程中的计算负担,本文在保护隐私的多标记分类方法中引入两个不共谋的云服务器,提出了一种云环境下保护隐私的多标记分类方法。本文提出的方法利用加法同态加密和一系列安全多方计算协议,将多标记分类的任务外包给云服务器。本方法不仅能够在完成多标记分类任务的同时保护用户和训练数据拥有者的隐私信息,还能够大大减小二者的存储费用开销和计算负担。证明了方法的安全性,分析了方法的计算和通信复杂度,模拟实验验证了方法的效率。
其他文献
知识吸收能力是一种多维度能力,能够影响企业竞争优势,但是,由于概念可操作化困难,概念界定、影响因素、组织产出差异较大,其理论发展缓慢。分析知识吸收能力的三种维度研究现状,提
随着《高等学校辅导员职业能力标准》的颁发,辅导员队伍建设有了强有力的政策依据。推进高校辅导员的专业化培养是提升队伍水平和增强学生工作实效性的有效途径和手段。通过
<正>在社会主义社会中,强调进行共产主义道德教育是十分必要也是非常现实的.邓小平同志多次指出,没有共产主义思想和共产主义道德是不能建设社会主义的.在最近召开的全国科学
摘要:计划生育是我国的基本国策之一,而农村的人口问题是我国计划生育工作中尤为突出和亟需解决的问题,也是制约我国社会与经济发展的主要因素。如何解决农村的人口和计划生育
绥中发电公司2012年发电耗用煤炭739万吨,燃料成本约占营业成本的70%。煤场库存容量57万立方米,2012年平均库存32万吨,2012年9月达到60万吨。煤场库存煤量高时,置换周期长达
目的:探讨腹腔镜全麻下盆腔淋巴结清扫术后形成并发症及盆腔淋巴囊肿的诊治情况,术中及术后各类指标的变化,淋巴囊肿形成的影响因素、其他并发症发生情况及处理方式,寻找能更
教育研究的实践转向已成为众多研究者的共同旨趣。已有的对于教育实践的解读存在着诸多误读现象。其根源在于教育理论研究者存在着四种假设:一是等级假设;二是趋同假设;三是
针对天然矿物原料制得的陶瓷制品存在烧成温度高、制品烧成不稳定等问题。本论文结合日用瓷烧成制度和注浆成型坯体,通过合理设计釉料配方以适应中低温烧成温度。采用海碧蓝
党的十八大报告提出:“要深入开展社会主义核心价值体系学习教育,用社会主义核心价值体系引领社会思潮、凝聚社会共识”。习近平总书记强调:“青年兴则国家兴,青年强则国家”。重
近几年由于煤矿开采强度普遍增大,地下煤炭的开采引起的地表沉陷不仅破坏矿区生态环境、损害地表建筑物和构筑物,且伴生严重的安全隐患,而解决这些问题的根本出路在于开采空