论文部分内容阅读
摘要:在大数据背景下,海量数据的处理对网络中数据中心的虚拟化、数据迁移等问题提出了非常高的要求。作为一种典型的网络虚拟化技术,针对传统数据中心存在的诸多问题,VXLAN技术通过在三层网络上建立二层的逻辑隧道,使二层网络数据能够穿越三层承载网络传递,实现了租户虚拟机跨三层网络的迁移,有效提高了数据中心的数据传输效率和硬件资源的利用率。
关键词:大数据;数据中心;虚拟机;VXLAN;报文
中图分类号:TP393.1 文献标识码:A 文章编号:1009-3044(2017)25-0030-02
Abstract: In the background of large data, the processing of massive data puts forward very high requirements for the virtualization of data centers and data migration in the network. As a kind of typical network virtualization technology, aiming at the problems existing in the traditional data center, VXLAN technology through the establishment of two logical tunnel in the three layer network, the two network data through three layers of network transmission, realizes the virtual machine migration tenants across the three layer network, effectively improve the utilization the data center data transmission efficiency and the rate of hardware resources.
Key words: big data; data center; virtual machine; vxlan; message
1 概述
大數据又被称为海量数据或巨量数据,指的是其所涉及的数据量的规模巨大到了无法通过人工在合理的时间内达到截取、管理、处理,并整理成人类所能够解读的信息。随着大数据时代的到来,网络中的数据量呈指数级增长,而网络中数据的存储、交换和管理则依赖于网络中的数据中心。数据中心(Data Center)通常是指在一个物理空间内实现信息集中处理、存储、传输、交换、管理的场所,它是对海量数据进行运算、交换和存储的中心。在大数据时代,随着云计算、虚拟化等相关技术的不断发展和应用,传统的数据中心架构已经很难满足分布式处理中数据迁移的需求,因此产生了诸如VXLAN、NVGRE、STT等技术。其中VXLAN由于支持的厂商众多而得到了广泛的应用。
2 传统数据中心的结构和存在的问题
2.1 传统数据中心的结构
传统的数据中心的网络结构按照经典的三层架构,即接入层、汇聚层和核心层,进行部署。在接入层连接的大量的服务器则按照不同的业务功能进行分区,包括内网服务器区、外网服务器区、互联网服务器区以及数据中心管理区等。在传统的数据中心中,一个业务区域通常集中了该业务所需的计算、网络及存储资源,不同的分区通过划分为不同的安全分区或VLAN进行隔离,分区之间或者禁止互访,或者经由三层网络进行互访,数据中心的网络流量大部分集中于南北向。这种数据中心结构是IT资源独立、软件硬件紧密耦合时代的产物,很好地满足了当时对数据处理的需求。
2.2 传统数据中心存在的问题
2.2.1 东西向流量延迟太高
随着数据量的不断增大,为充分利用硬件资源,在数据中心引入了虚拟化技术,而虚拟化技术需要将数据中心各个业务分区间的资源进行池化,实现数据中心资源的有效利用,这就使数据流量模型从传统的南北向流量转变为东西向流量。而由于同一物理服务器上可能部署了大量的虚拟机,造成流量的并发量大增,使数据中心网络中存在大量的多对一、多对多的东西向流量。而东西向的流量又必须通过汇聚层的三层网络进行传递,这就造成了东西向流量传递的高延迟,而这种高延迟对于数据中心而言是不可接受的。
2.2.2 虚拟机动态迁移受限
虚拟机动态迁移是指在保证虚拟机上的服务能够正常运行的同时,将一个虚拟机系统在物理上从一个服务器移动到另一个服务器的过程,这种技术在数据中心的实际应用中非常常见。例如,当需要对一台服务器进行升级维护的时候,就需要通过虚拟机动态迁移技术将该服务器上的虚拟机系统暂时迁移到另一台物理服务器上,然后等服务器升级维护完成后,再将虚拟机系统迁移回来即可。需要注意的是,该迁移过程对用户而言是无感知的,即迁移过程中虚拟机系统提供的服务不能中断,这就要求参与迁移的物理服务器之间必须二层可达,一旦跨越三层网络,就需要改变IP地址,那么其所承载的服务必然会中断。而传统的数据中心汇聚层即为三层网络,这就限制了虚拟机的动态迁移范围只能在同一汇聚层交换机之下,而无法实现数据中心内部的任意迁移,更遑论跨数据中心的迁移。
3 VXLAN技术
通过对传统数据中心存在的问题进行分析可以发现,问题的核心在于跨三层网络带来的限制,因此在解决方案中需要通过Overlay技术增加封装,将MAC地址封装在IP地址之上,将网络拓扑由物理三层转变为逻辑二层,进而在数据中心内部以及数据中心之间建立二层的逻辑隧道,如图1所示,从而提高东西向流量的传递效率,实现跨数据中心的虚拟机动态迁移。 3.1 VXLAN组网架构
作为NVO3(Network Virtualization Over Layer 3)定义的标准技术之一,VXLAN(Virtual eXtensible Local Area Network)技术可将二层报文用三层协议进行封装,从而实现二层网络在三层范围内的扩展,以满足数据中心大二层虚拟机迁移的需求。其具体的组网逻辑架构如图2所示。
在图2所示的组网结构中,NVE(Network Virtualization Edge)被称为网络虚拟边缘,部署在VXLAN网络的边缘,主要负责进行VLAN网络和VXLAN网络之间数据的封装和解封装,经过NVE的封装转换以后,NVE之间就可以基于三层基础网络建立Overlay的二层虚拟化网络。NVE可以分为软件NVE和硬件NVE两种,软件NVE一般是在服务器上安装的软件包,而硬件NVE则集成在交换机上,由于交换机同时是划分和连接VLAN的设备,因此NVE又是VXLAN的二层或三层网关,其中二层网关主要实现VXLAN与VLAN、MAC地址等之间的二层映射,而三层网关主要实现VXLAN报头与IP报头之间的映射。当然不管是二层VXLAN网关还是三层VXLAN网关,都是用来实现VXLAN网络与非VXLAN网络之间的连接。
3.2 VXLAN报文封装
VXLAN采用MAC in UDP的封装方式将二层报文用三层协议进行封装,具体的封装结构如图3所示。
從上图的报文封装结构中可以看出,原始的二层报文外部增加了VXLAN的封装。在VXLAN的封装中,VNI字段是VXLAN的网络标识,用于区分不同的VXLAN段,VXLAN提供了24bit的VNI字段,最多可满足16M租户。外层的UDP封装中,目的端口号为4789,而源端口号则是内层以太网报头通过哈希算法计算后的值。外层IP头封装中,源IP地址和目的IP地址分别为源虚拟机和目的虚拟机所属VTEP(VLAN Tunnel End Point)的IP地址。外层Ethernet头封装中,源MAC地址和目的MAC地址为当前报文所处链路的两端设备的MAC地址。
在VXLAN报文从Ingress NVE到Egress NVE的传递过程中,外层的MAC地址逐跳改变,但VXLAN内部封装的原始报文则一直保持不变,从而使源终端的二层报文能够穿越三层IP网络到达目的终端。实际上,VXLAN网络对于进行通信的跨三层网络的主机而言,相当于是一个Bridge Fabric,用来实现逻辑上的二层通信。
4 总结
VXLAN技术通过在原有数据报文外部增加封装的方式,使用MAC in UDP技术在三层IP网络中建立了二层逻辑隧道,实现了网络的逻辑扁平化,使二层数据报文可以穿越承载网络,提高了数据中心网络东西向流量的传递效率,实现了跨数据中心的虚拟机动态迁移,有效提高了大数据、云计算背景下数据中心的资源利用率和管理效率。
参考文献:
[1] 华为公司.HCNP-R
关键词:大数据;数据中心;虚拟机;VXLAN;报文
中图分类号:TP393.1 文献标识码:A 文章编号:1009-3044(2017)25-0030-02
Abstract: In the background of large data, the processing of massive data puts forward very high requirements for the virtualization of data centers and data migration in the network. As a kind of typical network virtualization technology, aiming at the problems existing in the traditional data center, VXLAN technology through the establishment of two logical tunnel in the three layer network, the two network data through three layers of network transmission, realizes the virtual machine migration tenants across the three layer network, effectively improve the utilization the data center data transmission efficiency and the rate of hardware resources.
Key words: big data; data center; virtual machine; vxlan; message
1 概述
大數据又被称为海量数据或巨量数据,指的是其所涉及的数据量的规模巨大到了无法通过人工在合理的时间内达到截取、管理、处理,并整理成人类所能够解读的信息。随着大数据时代的到来,网络中的数据量呈指数级增长,而网络中数据的存储、交换和管理则依赖于网络中的数据中心。数据中心(Data Center)通常是指在一个物理空间内实现信息集中处理、存储、传输、交换、管理的场所,它是对海量数据进行运算、交换和存储的中心。在大数据时代,随着云计算、虚拟化等相关技术的不断发展和应用,传统的数据中心架构已经很难满足分布式处理中数据迁移的需求,因此产生了诸如VXLAN、NVGRE、STT等技术。其中VXLAN由于支持的厂商众多而得到了广泛的应用。
2 传统数据中心的结构和存在的问题
2.1 传统数据中心的结构
传统的数据中心的网络结构按照经典的三层架构,即接入层、汇聚层和核心层,进行部署。在接入层连接的大量的服务器则按照不同的业务功能进行分区,包括内网服务器区、外网服务器区、互联网服务器区以及数据中心管理区等。在传统的数据中心中,一个业务区域通常集中了该业务所需的计算、网络及存储资源,不同的分区通过划分为不同的安全分区或VLAN进行隔离,分区之间或者禁止互访,或者经由三层网络进行互访,数据中心的网络流量大部分集中于南北向。这种数据中心结构是IT资源独立、软件硬件紧密耦合时代的产物,很好地满足了当时对数据处理的需求。
2.2 传统数据中心存在的问题
2.2.1 东西向流量延迟太高
随着数据量的不断增大,为充分利用硬件资源,在数据中心引入了虚拟化技术,而虚拟化技术需要将数据中心各个业务分区间的资源进行池化,实现数据中心资源的有效利用,这就使数据流量模型从传统的南北向流量转变为东西向流量。而由于同一物理服务器上可能部署了大量的虚拟机,造成流量的并发量大增,使数据中心网络中存在大量的多对一、多对多的东西向流量。而东西向的流量又必须通过汇聚层的三层网络进行传递,这就造成了东西向流量传递的高延迟,而这种高延迟对于数据中心而言是不可接受的。
2.2.2 虚拟机动态迁移受限
虚拟机动态迁移是指在保证虚拟机上的服务能够正常运行的同时,将一个虚拟机系统在物理上从一个服务器移动到另一个服务器的过程,这种技术在数据中心的实际应用中非常常见。例如,当需要对一台服务器进行升级维护的时候,就需要通过虚拟机动态迁移技术将该服务器上的虚拟机系统暂时迁移到另一台物理服务器上,然后等服务器升级维护完成后,再将虚拟机系统迁移回来即可。需要注意的是,该迁移过程对用户而言是无感知的,即迁移过程中虚拟机系统提供的服务不能中断,这就要求参与迁移的物理服务器之间必须二层可达,一旦跨越三层网络,就需要改变IP地址,那么其所承载的服务必然会中断。而传统的数据中心汇聚层即为三层网络,这就限制了虚拟机的动态迁移范围只能在同一汇聚层交换机之下,而无法实现数据中心内部的任意迁移,更遑论跨数据中心的迁移。
3 VXLAN技术
通过对传统数据中心存在的问题进行分析可以发现,问题的核心在于跨三层网络带来的限制,因此在解决方案中需要通过Overlay技术增加封装,将MAC地址封装在IP地址之上,将网络拓扑由物理三层转变为逻辑二层,进而在数据中心内部以及数据中心之间建立二层的逻辑隧道,如图1所示,从而提高东西向流量的传递效率,实现跨数据中心的虚拟机动态迁移。 3.1 VXLAN组网架构
作为NVO3(Network Virtualization Over Layer 3)定义的标准技术之一,VXLAN(Virtual eXtensible Local Area Network)技术可将二层报文用三层协议进行封装,从而实现二层网络在三层范围内的扩展,以满足数据中心大二层虚拟机迁移的需求。其具体的组网逻辑架构如图2所示。
在图2所示的组网结构中,NVE(Network Virtualization Edge)被称为网络虚拟边缘,部署在VXLAN网络的边缘,主要负责进行VLAN网络和VXLAN网络之间数据的封装和解封装,经过NVE的封装转换以后,NVE之间就可以基于三层基础网络建立Overlay的二层虚拟化网络。NVE可以分为软件NVE和硬件NVE两种,软件NVE一般是在服务器上安装的软件包,而硬件NVE则集成在交换机上,由于交换机同时是划分和连接VLAN的设备,因此NVE又是VXLAN的二层或三层网关,其中二层网关主要实现VXLAN与VLAN、MAC地址等之间的二层映射,而三层网关主要实现VXLAN报头与IP报头之间的映射。当然不管是二层VXLAN网关还是三层VXLAN网关,都是用来实现VXLAN网络与非VXLAN网络之间的连接。
3.2 VXLAN报文封装
VXLAN采用MAC in UDP的封装方式将二层报文用三层协议进行封装,具体的封装结构如图3所示。
從上图的报文封装结构中可以看出,原始的二层报文外部增加了VXLAN的封装。在VXLAN的封装中,VNI字段是VXLAN的网络标识,用于区分不同的VXLAN段,VXLAN提供了24bit的VNI字段,最多可满足16M租户。外层的UDP封装中,目的端口号为4789,而源端口号则是内层以太网报头通过哈希算法计算后的值。外层IP头封装中,源IP地址和目的IP地址分别为源虚拟机和目的虚拟机所属VTEP(VLAN Tunnel End Point)的IP地址。外层Ethernet头封装中,源MAC地址和目的MAC地址为当前报文所处链路的两端设备的MAC地址。
在VXLAN报文从Ingress NVE到Egress NVE的传递过程中,外层的MAC地址逐跳改变,但VXLAN内部封装的原始报文则一直保持不变,从而使源终端的二层报文能够穿越三层IP网络到达目的终端。实际上,VXLAN网络对于进行通信的跨三层网络的主机而言,相当于是一个Bridge Fabric,用来实现逻辑上的二层通信。
4 总结
VXLAN技术通过在原有数据报文外部增加封装的方式,使用MAC in UDP技术在三层IP网络中建立了二层逻辑隧道,实现了网络的逻辑扁平化,使二层数据报文可以穿越承载网络,提高了数据中心网络东西向流量的传递效率,实现了跨数据中心的虚拟机动态迁移,有效提高了大数据、云计算背景下数据中心的资源利用率和管理效率。
参考文献:
[1] 华为公司.HCNP-R