论文部分内容阅读
支持向量机是在统计学习理论基础上发展起来的新一代数据挖掘方法,在文字识别、手写体识别、图像分类、生物信息学等领域中获得了较好的应用。与传统的神经网络等方法相比,它具有泛化能力强、维数不敏感、收敛到全局最优解等优点,很好地解决了过学习、维数灾难、局部极值等问题,成为近几年数据挖掘领域中的一个非常活跃的研究方向。本文围绕传统支持向量机模型与算法在实际应用中遇到的隐私保护问题,探讨了垂直分布和水平分布数据下的隐私保护支持向量机算法。本文介绍了数据挖掘的概念、过程,介绍了支持向量机产生的背景、模型与算法及其算法的进展情况,总结了支持向量机的优点以及应用领域,分析了支持向量机在实际应用中存在的个人信息泄露问题。针对隐私保护支持向量机提出了垂直分布数据和水平分布数据的隐私保护算法。首先,对SSP协议进行扩展,提出了一个基于垂直分布数据的隐私保护支持向量机算法,这个算法具有更高的效率和更好的安全性,并且,通过左乘一个可逆矩阵的形式对数据进行保护,得到了一个关于水平分布数据的隐私保护算法,同样保证了数据的隐私性;然后,运用加法同态加密的办法,对数据进行加密,在不泄露每一方的局部核矩阵的情况下,得到了一个利用密码学理论的垂直分布数据的隐私保护支持向量机算法,保证了数据的隐私性。