一、数据中心之间的互联方式

数据中心间通常部署三种互联链路,每种互联链路所承载的 数据不同,实现的功能不同,并且这三种链路在逻辑上相互隔离。

1. 网络三层互联

也称为数据中心前端网络互联,所谓"前端网络"是指数据中 心面向企业园区网或企业广域网的出口。不同数据中心(主中心、灾备中心)的 前端网络通过 IP 技术实现互联,园区或分支的客户端通过前端网络访问各数据 中心。当主数据中心发生灾难时,前端网络将实现快速收敛,客户端通过访问灾 备中心以保障业务连续性。

2. 网络二层互联

也称为数据中心服务器网络互联。在不同的数据中心服务器 网络接入层,构建一个跨数据中心的大二层网络(VLAN),以满足服务器集群 或虚拟机动态迁移等场景对二层网络接入的需求。

3. SAN 互联

也称为后端存储网络互联。借助传输技术(DWDM、SDH 等) 实现主中心和灾备中心间磁盘阵列的数据复制。

Responsive image

图1. 数据中心的三种互联方式

二、数据中心二层互联的业务需求

1. 服务器高可用集群

服务器集群(Cluster),是借助集群软件将网络上的多台服务器关联在一起, 提供一致的服务,对外表现为一台逻辑服务器。多数厂商(HP、IBM、微软、 Veritas、DELL 等)的集群软件需要各服务器间采用二层网络互联。将集群中的 服务器部署于不同数据中心,可实现跨数据中心的应用系统容灾。

2. 服务器搬迁和虚拟机动态迁移

数据中心进行扩建或搬迁时,需要将物理服务器从一个数据中心迁至另一 个数据中心。在此过程中,考虑以下两个因素,需要在数据中心间构建二层互联 网络: 当服务器被迁至新机房,如未构建新老中心间的二层互联网络,则面临重新 规划新中心服务器 IP 地址的问题,同时还需修改 DNS,或修改客户端应用程序 配置的服务器 IP。因此,构建跨中心的二层互联网络可保留被迁移服务器的 IP 地址,进而简化迁移过程; 在服务器搬迁期间,经常在给定的时间内,只能将服务器群的一部分服务器 迁至新中心,为保证业务连续性,需建立跨中心的服务器集群,构建跨越中心的

3. 二层互联网络可实现服务器平滑迁移。

与服务器搬迁类似的情况是"虚拟机迁移"。当前,一些服务器虚拟化软件可 实现在两台虚拟化的物理服务器之间对虚拟机做动态迁移(如图 2 所示)。迁移 至另一中心的虚拟机不仅保留原有 IP 地址,而且还保持迁移前的运行状态(如 TCP 会话状态),所以必须将涉及虚拟机迁移的物理服务器接入同一个二层网络 (虚拟机在迁移前后的网关不变),这种应用场景要求构建跨中心的二层互联网 络。

Responsive image

图2. 虚拟机动态迁移

三、挚云数据中心二层互联设计充分考虑了以下几个要点

1. 前提要素—现网状态

选择数据中心二层互联方案的前提要素是明确用户在多个数据中心之间具 有哪些网络资源。网络资源的不同直接决定了用户将采用何种组网方案。

2. 核心要素—性能

● 时延

数据中心之间二层互联是为了实现虚拟机的异地调度和集群异地应用,为 了实现这一点,必须满足虚拟机迁移和集群存储异地访问的时延要求。第一个限 制是迁移同步会话距离。第二个要求是存储网络。DC 之间的存储必须实现同步 访问或是镜像访问。 需要注意的是,在 VPLS 或是 IP 网络环境中,由于网络中存在大量复杂的 应用,所以必须通过部署全网 QoS 来保证 DCI 互联数据流的服务质量。流量环 境越复杂,则 QoS 配置工作量越大,时延指标越难以满足。VPLS 网络通常应 用于企业或是行业的专用业务,流量环境相对于 IP 网络较简单,所以在部署 QoS 方面有一定优势。

● 带宽

数据中心互联的核心需求之一就是保证虚拟机跨 DC 的迁移。vSphere 5.0 之前的版本,VMotion 对于迁移链路的带宽有明确的要求—带宽不小于 622M; vSphere 5.0 的版本,VMotion 对于迁移链路的带宽不小于 250M。 从带宽资源的分配情况来看,裸光纤或 DWDM 的带宽资源最为充足,VPLS 和 IP 网络的带宽资源相对紧张,必须部署全网端到端的 QoS 优先级来保证 DCI 业务流量的带宽要求。

3. 关键要素—— HA

数据中心二层互联的关键因素就是如何提高可用性。提高 HA 的一个最有 效的方式就是设计备份链路、备份节点。如果结合提高互联带宽的需求,则建议 设计负载分担的互联路径,在提高互联带宽的同时,也能够保证系统异常时能够 实现业务的快速收敛,提高 HA 指标。 以 DWDM 网络为例,建议利用 IRF 实现 DCI 链路的高 HA 和链路负载分 担设计方案。 在裸光纤或是 DWDM 互联组网方案中,DCI 互联的两端 PE 设备必须支持 IRF,将 PE 之间的两条(或多条)链路通过聚合(LACP)技术形成一条逻辑链 路,会极大的简化 DCI 的组网拓扑。同时,这两条 HA 链路的带宽会得到 100% 的利用,达到 1:1 的负载分担效果(如图 3 所示)。

Responsive image

图3. IRF+LACP负载分担设计方案