论文部分内容阅读
随着互联网的飞速发展,云计算作为一种计算模式,也在全世界范围内普及。云计算的用户能够通过不同的网络,以便利的、按需付费的方式从一个可配置的共享的资源池中获取计算资源,包括CPU计算资源、内存资源、存储资源、网络带宽、软件应用和服务等,不仅能够提高资源的可用性,而且可以节省人力与降低前期投资成本。正是云计算所能带来的便利,越来越多的企业或个人将业务与数据外包到云计算中。云计算外包也成为了一个必然的趋势和潮流。通过外包,用户能够从繁重的计算、维护和管理任务中释放出来,而且不再受制于有限的本地资源设施,并可通过按需付费的低成本方式将业务外包给云计算服务提供商。然而,用户将业务和数据外包给云计算,也意味着用户放弃了对程序与业务的直接控制权,而且程序与业务的隐私将暴露给云计算服务提供商。云计算服务提供商会有意或无意地从用户数据与程序中挖掘敏感数据和隐私信息等。对数据安全与隐私保护的考虑,成为云计算外包发展的一个重要障碍。针对以上这些问题,本文研究面向外包过程中云计算安全的几个关键技术,并以极限学习机为主要突破口,主要的研究内容与成果包括:(1)应对大数据的极限学习机外包机制:提出了一个云计算环境下安全与实用的极限学习机外包机制。在大数据背景下,数据的种类多样与规模巨大等特点给极限学习带来严峻的挑战。首先对极限学习机进行算法复杂度分析与性能分析。通过分析,隐层输出矩阵的广义逆求解过程是极限学习机算法中对计算资源和存储资源需求最高的部分。因此,本文显式地将极限学习机分为公开部分和私有部分。其中,私有部分一直保留在用户本地执行,负责随机分配隐层节点参数和解析求解输出权值矩阵,以及隐层输出矩阵的计算;公开部分主要负责隐层输出矩阵广义逆的计算,并将结果反馈给用户。用户对返回的结果进行验证,并由此解析求得ELM的输出权值矩阵,从而完成对数据的学习。随后,再充分挖掘外包过程的并行性,进一步提高极限学习机的训练速度。由于隐层节点参数的随机性以及训练数据一直保存在本地,并未暴露给云计算服务提供商。因此,本文提出的极限学习机外包机制能够保证用户数据的安全与隐私。实验证明该外包机制能够有效地让用户从繁重的科学计算中释放出来,并提高极限学习机的训练速度。(2)云计算环境下ELM外包优化部署策略:提出了一种ELM外包的优化部署策略。第一部分内容在求解隐层输出矩阵的广义逆是采用奇异值分解的方法,并在用户与云计算服务提供商之间发送和接收隐层输出矩阵及其广义逆。这种方法适用于所有类型的隐层输出矩阵。然而在训练大数据时,样本的数量非常大,对隐层节点数量的需求也随着增大,直接导致隐层输出矩阵的规模非常庞大,从而引入了比较大的额外通信延迟。本部分内容采用正态投影法来求解矩阵的广义逆,并添加一个正则化项来提高ELM学习算法的泛化性能。外包到云计算环境的操作为隐层矩阵转置与隐层矩阵的逆。在该部署策略下,用户与云计算服务提供商之间发送与接收的矩阵大小只与隐层节点数量相关,从而大大降低通信延迟。实验证明,采用优化部署策略,能更好地提高极限学习机的训练速度。(3)多机构协作的外包机制:提出了一个安全的多机构协作极限学习机外包机制。将单一的外包机构扩展为多机构协作的外包机制。机构之间存在协作与竞争关系,即一个机构并不愿意将其收集的数据直接暴露于其他机构。在现实中,多机构协作的方式更为常见,主要分为水平方式和垂直方式。垂直方式中,不同机构贡献针对同一事件的不同数据特征。每一个机构负责随机生成所贡献特征相对应输入节点的权值矩阵。在水平方式中,不同机构贡献相同特征的数据。多个机构之间可以首先通过投票选举出一个机构作为主机构来负责隐层节点参数的随机生成,或者将其委托一个可信的第三方。(4)可信第三方或主机构的安全问题:提出了一个TCP-友好的应对低速率分布式拒绝服务攻击(Low-rate Distributed Denial-of-Service,LDDoS)的主动队列管理算法。一旦可信机构被攻击者攻陷,则依赖于该机构上的涉及敏感数据与隐私的业务也将受到重要影响。LDDoS攻击作为一个隐蔽而又高效的攻击,其检测与防御给保护可信机构和主动队列管理算法(Active Queue Management,AQM)提出了严峻的挑战。LDDoS攻击的本质特征是不规避网络拥塞,反而在拥塞时继续发送攻击报文。根据这一本质特征,对可疑攻击报文进行检测。提出了一个公平鲁棒随机早检测算法(Fair Robust Random Early Detection,FRRED),采用一种精心设计的空间高效Bloom过滤器与基于协议的Hash划分相结合,来记录每个正常流和攻击流的信息,并依此对攻击报文进行检测与丢弃。实验证明,在应对LDDoS攻击时,FRRED算法能取得比其他AQM算法更高的吞吐量与更好的公平性。