论文部分内容阅读
2019年10月,党的十九届四中全会中首次增列“数据”为生产要素,随后指出要围绕数据要素加快构建数据市场,助推国家占领数字经济的全球竞争制高点。同时,随着移动网络、社交网络应用以及智能世界系统的发展,大量的数据正在被收集。当前,这些数据被存储在各个机构或企业的数据库中,形成一座座“数据孤岛”。依托于机器学习和数据挖掘技术等一系列新技术的应用需要多方数据的融合才能发挥出数据中蕴含的价值。因此,数据的流通共享是数据市场培育的核心内容。然而,公益性或免费的数据共享在现实中是很难实现的,基于经济驱动的数据交易正在成为一种实现数据共享的有效方式。通过数据市场,数据所有者可以出售数据以获取合理的报酬,数据消费者可以购买满足其业务需求的海量数据,从而提高其研究、产品或服务的质量。因此,数据交易对数据所有者和消费者来说是一个合作共赢的过程。然而,数据作为一种虚拟商品,其可变、多样、海量、高速和复杂的基本特征,为当前主要面对实物商品的交易模式带来了挑战。所以,要实现大数据的真正价值和效用,必须重新评估和完善传统的交易模式。同时,数据还具有易泄露、低复制成本、富含隐私信息等特性,对交易的安全和隐私保护具有更为迫切的需求。因此,如何构建有效的数据交易模型,并且保障交易的安全与隐私保护是需要研究的问题。本文在现有基础与条件下,围绕数据交易的优化以及交易过程中的隐私保护问题展开研究,主要研究内容和创新性工作如下:(1)面向平台收益优化的安全数据交易模型研究针对当前数据交易平台可能泄露数据所有者数据隐私的问题,提出了一种面向平台收益优化的安全数据交易模型。数据所有者在收集到数据消费者所需求的数据后,会在本地对数据进行一定的分析,然后将分析结果按照平台分配的隐私预算添加噪声后发送给平台,以保护自身的数据隐私。为激励数据消费者和数据所有者积极参与交易,在考虑消费者对结果偏差的容忍约束和所有者的隐私泄露补偿的基础上构建了交易优化模型以优化平台的收益,并给出了基于遗传算法的收益优化算法来求解该模型。在收益优化算法中,平台根据消费者所提交的偏差约束和报酬信息以及数据所有者的报价,生成种群,并以最大化自身的收益为目标,通过种群的选择、遗传和变异等操作,计算出最优的结果。仿真结果表明,该算法不仅保护了数据所有者的数据隐私,而且数据交易平台的收益在该方法下也能够得到进一步的提高。(2)面向系统效用优化的安全数据交易模型研究针对集中式数据交易方案存在的数据隐私泄露风险,以及当前研究仅考虑数据交易平台的收益,在系统的整体效用方面存在局限性的问题,提出了一种面向系统效用优化的安全数据交易模型。该模型实现了数据所有者和数据消费者点对点的数据交易,解决了集中式方案中所具有的数据隐私泄露危机。同时,构建了以最大化系统效用为目标的数据交易优化模型,以提高数据交易的整体效用。为了求解该模型,同时在求解过程中保护数据消费者和数据所有者的敏感个人信息隐私,提出了一种双向拍卖机制。在该机制中,数据代理根据数据消费者和所有者所提交的报价信息计算数据交易量,消费者和所有者根据数据交易量更新报价,经过多轮迭代,确定交易方案。双向拍卖机制仅通过消费者和所有者提供的报价即可完成模型的求解,从而避免了他们敏感个人信息的泄露。为了鼓励数据所有者提供高质量的数据和高效的数据传输服务,构建了信誉模型,并提出了信誉证明(Proof of Reputation,PoR)共识机制。理论分析和仿真结果表明,该模型不仅保护了数据所有者和消费者的敏感个人信息隐私,而且在系统效用方面有更好的表现。(3)面向多目标优化的安全数据交易模型研究针对集中式数据交易方案所面临的安全危机以及当前方案在效率方面存在不足,和当前研究仅考虑了数据本身因素而忽略了消费者需求因素的问题,提出了一种面向多目标优化的安全数据交易模型。该模型采用联盟链实现了点对点的数据交易,不仅保护了数据所有者的数据隐私,而且提升了交易的吞吐量和效率。通过综合考虑数据本身以及消费者需求两方面的因素,基于数据质量、数据属性、属性的相关性、消费者竞争等多维因素构建了双层多目标优化模型,优化了数据所有者和数据消费者的效用。为求解上述模型,并且在求解过程中保护数据所有者和消费者的敏感个人信息隐私,提出了一种改进的多目标遗传算法——协作式 NSGAⅡ(Non-dominated Sorting Genetic Algorithm Ⅱ)。该算法通过数据所有者、数据消费者以及数据代理的协作进行模型求解。数据所有者和数据消费者在本地完成各自效用函数的计算,数据代理完成种群的非支配排序,从而避免了敏感信息的泄露。理论分析和仿真结果表明,所提模型不仅保护了数据所有者和消费者的敏感个人信息隐私,同时在他们的效用方面取得了更好的性能。