论文部分内容阅读
在求解线性规划的最优解时,目标函数的系数、等式约束的约束矩阵以及右边的向量可能被不同的实体拥有,这些实体不愿意泄露这些数据,这就产生了隐私问题,如何在不泄露这些实体的数据的情况下计算出线性规划的最优解就成了急需解决的课题。支持向量机是应用在数据挖掘领域的一种新的方法,与传统的机器学习理论相比具有更多的优点,支持向量机能克服传统机器学习过程中的过学习、维数灾难、局部极值等问题。分布式支持向量机是把训练样本分配到各个节点,能克服数据交流的复杂性、易变性和隐私问题。本文首先介绍了线性规划的隐私保护算法, Mangasarian在数据垂直分布和水平分布的线性规划的隐私保护算法中采用了一个随机矩阵,将原始的线性规划问题转化成了一个安全的线性规划问题。但是,当这个随机矩阵不可逆的时候,原始线性规划问题和安全的线性规划问题是不等价的。针对这种情况,采用一个可逆随机矩阵,将原始线性规划问题转化成了一个等价的安全的线性规划问题。实验结果表明,只要λ充分大,用本文算法求得的结果与用原始线性规划求得的结果相一致。其次本文介绍了支持向量机的基本理论以及基于一致性的分布式支持向量机的基本原理,把每一个实体拥有的数据看作一个节点,利用基于一致性的分布式支持向量机的基本原理,为水平分布数据设计了相应的求解算法,该算法可以保证数据的隐私性。