华为IP(5)
交换机的堆叠与集群
堆叠和集群指的是同一件事
前言:
随着企业的发展,企业网络的规模越来越大,这对企业网络提出了更高的要求:更高的可靠性、更低的故障恢复时间、设备更加易于管理等。
传统的园区网高可靠性技术出现故障时很难做到毫秒级别、实现可靠性的方案通常为一主一备,存在严重的资源浪费。同时随着网络设备的越来越多,管理将会变得越加复杂。为构建可靠、易管理、资源利用率高、易于扩展的交换网络,引入了交换机堆叠、集群技术。
堆叠、集群简介:
堆叠(iStack):将多台支持堆叠特性的交换机通过堆叠线缆连接在一起,从逻辑上虚拟成一台交换设备,作为一个整体参与数据转发。最多可以有16台交换机进行堆叠
集群(Cluster Switch System,CSS):将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。只支持两台设备进行集群
一般高端框式交换机支持CSS、低端盒式设备支持iStack。
通过使用堆叠、集群技术结合链路聚合技术可以简单构建高可靠、无环的园区网络。
堆叠、集群架构:
使用堆叠、集群技术将独立的交换机虚拟化成一台逻辑的交换机,一般(接入、汇聚层)低端盒式交换机采用堆叠技术,(汇聚、核心层)高端框式交换机采用集群技术。
在逻辑交换机之间使用链路聚合技术,无需部署STP、VRRP实现高可靠性。
实现高可靠性的同时设备之间的链路可以同时传输流量,链路利用率得以提升。
堆叠、集群的优势:
1)使用堆叠、集群可有效提高资源利用率,获得更高的转发性能、链路带宽。
2)使用堆叠、集群可以降低网络规划的复杂度,方便对于网络的管理。
3)使用堆叠、集群可以大大降低故障导致的业务中断时间。
堆叠
堆叠的基本概念
1)堆叠系统中所有的单台交换机都称为成员交换机,按照功能不同,可以分为三种角色:
主交换机(Master):主交换机负责管理整个堆叠。堆叠系统中只有一台主交换机。
备交换机(Standby):备交换机是主交换机的备份交换机。堆叠系统中只有一台备交换机。当主交换机交换机故障时,备交换机会接替原主交换机的所有业务。
从交换机(Slave):从交换机用于业务转发,堆叠系统中可以有多台从交换机。从交换机数量越多,堆叠系统的转发带宽越大。除主交换机和备交换机外,堆叠中其他所有的成员交换机都是从交换机。当备交换机不可用时,从交换机承担备交换机的角色。
2)堆叠优先级:
堆叠优先级是成员交换机的一个属性,主要用于角色选举过程中确定成员交换机的角色,,首先启动的越早成为主的可能性越大其次优先级值越大表示优先级越高,优先级越高当选为主交换机的可能性越大。
堆叠ID
1)堆叠ID,即成员交换机的槽位号(Slot ID),用来标识和管理成员交换机,堆叠中所有成员交换机的堆叠ID都是唯一的。
2)设备堆叠ID缺省为0。堆叠时由堆叠主交换机对设备的堆叠ID进行管理,当堆叠系统有新成员加入时,如果新成员与已有成员堆叠ID冲突,则堆叠主交换机从0~最大的堆叠ID进行遍历,找到第一个空闲的ID分配给该新成员。
3)在建立堆叠时,建议提前规划好设备的堆叠ID。
堆叠逻辑接口
堆叠逻辑接口:
交换机之间用于建立堆叠的逻辑接口,每台交换机支持两个逻辑堆叠端口,分别为stack-port n/1和stack-port n/2,其中n为成员交换机的堆叠ID。
一个逻辑堆叠端口可以绑定多个物理成员端口,用来提高堆叠的可靠性和堆叠带宽
堆叠成员设备之间,本端设备的逻辑堆叠端口stack-port n/1必须与对端设备的逻辑堆叠端口stack-port m/2(例如1/2与2/1相连)相连。
堆叠系统组建过程
物理连接——>主交换机选举——>拓扑收集和备交换机选举——>软件和配置同步
物理连接:
选择适当的连接方式和连接拓扑,组建堆叠网络。
主交换机选举:
成员交换机之间互相发送堆叠竞争报文,并根据选举规则,选出堆叠系统主交换机。
拓扑收集和备交换机选举:
主交换机收集所有成员交换的拓扑信息,向成员交换机分配堆叠ID,之后选出堆叠系统备交换机。
(首先堆叠优先级最高的交换机成为备交换机,其次当堆叠优先级相同时,MAC地址最小的成为备交换机)
软件和配置同步:
主交换机将堆叠系统的拓扑信息同步给所有成员交换机,成员交换机同步主交换机的系统软件和配置文件,之后进入稳定运行状态。
堆叠管理与配置文件
堆叠管理:
1)登录任意成员的Console口即可管理整个堆叠系统
2)与堆叠系统上的任意IP地址路由可达,即可通过Telnet、Stelnet、WVB、SNMP等方式登录、管理整个堆叠系统。
配置文件:
1)堆叠建立后,竞争为主的交换机的配置文件生效,整个堆叠系统的配置都保存在主交换机的配置文件中。
2)备交换机上会备份主交换机的配置文件,当主交换机故障时备份交换机的配置继续运行。
堆叠成员退出
堆叠成员退出是指成员交换机从堆叠系统中离开。根据退出成员交换机角色的不同,对堆叠系统的影响也有所不同:
1)当主交换机退出,备份交换机升级为主交换机,重新计算堆叠拓扑并同步到其他成员交换机,指定新的备交换机,之后进入稳定运行状态。
2)当备交换机退出,主交换机重新指定备交换机,重新计算堆叠拓扑并同步到其他成员交换机,之后进入稳定运行状态。
3)当从交换机退出,主交换机重新计算堆叠拓扑并同步到其他成员交换机,之后进入稳定运行状态。
堆叠成员加入
堆叠成员加入是指向已经稳定运行的堆叠系统添加一台新的交换机:
1)将未上电的交换机连线加入堆叠之后再上电启动,新加入的交换机会选举为从交换机,堆叠系统中原有主备从角色不变。
2)角色选举结束后,主交换机更新堆叠拓扑信息,同步到其他成员交换机上,并向新加入的交换机分配堆叠ID(新加入的交换机没有配置堆叠ID或配置堆叠ID与原堆叠系统的某个堆叠ID冲突时)。
3)新加入的交换机更新堆叠ID,并同步主交换机的配置文件和系统软件,之后进入稳定运行状态。
堆叠合并
堆叠合并是指稳定运行的两个堆叠系统合并成一个新的堆叠系统。
堆叠分裂
堆叠分裂是指稳定运行的堆叠系统中带电移除部分成员交换机,或者堆叠线缆多点故障导致一个堆叠系统变成多个堆叠系统。(多个堆叠系统中,每个堆叠系统中都有自己的主,备,从)
堆叠分裂引起的问题:
由于堆叠系统中所有成员交换机都使用同一个ip导致(VLANIF接口地址)和MAC地址(堆叠系统MAC),一个堆叠系统分裂后,可能产生多个具有相同IP地址和MAC地址的堆叠系统,从而引起网络故障,为此必须进行IP地址和MAC地址的冲突检查。
MAD检测:
多主检测MAD(Multi-Active Detection):一种检测和处理堆叠分裂的协议,链路故障导致堆叠系统分裂后,MAD可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对业务的影响。
MAD检测方式有两种:直连检测方式和代理检测方式。在同一个堆叠系统中,两种检测方式互斥,不可以同时配置。
直连检测
直连检测方式是指堆叠成员交换机间通过普通线缆直连的专用链路进行多主检测。在直连检测中,堆叠系统正常运行时,不发送MAD报文;堆叠系统分裂后,分裂后的两台交换机以1秒为周期通过检测链路发送MAD报文进行多主冲突处理。
开启直连检测的命令:
intface g0/0/1 //加入g0/0/1接口
dual-active detect mode direct //配置业务口双主检测功能的模式是直连检测
(mad detect mode relay //配置业务口双主检测功能的模式是代理检测)
MAD冲突处理
1)堆叠分裂后,MAD冲突处理机制使用MAD报文进行MAD竞选,竞选结果为堆叠系统处于Detect状态或者Recovery状态:
Detect:竞选成功,堆叠系统将处于正常工作状态。
Recovery:竞选失败,堆叠系统将状态处于禁用状态,关闭除手动配置的保留端口以外的其它所有物理端口。
2)MAD竞选原则:
MAD竞选原则与主交换机的竞选原则类似:
1.先比较启动时间,启动完成时间早的堆叠系统成为Detect状态。启动完成时间差在20秒内则认为堆叠的启动完成时间相同。
2.启动完成时间相同时,比较堆叠中主交换机的优先级,优先级高的堆叠系统成为Detect状态。
3.优先级相同时,比较堆叠系统的MAC,MAC小的堆叠系统成为Detect状态。
堆叠主备倒换:
如果堆叠系统当前的主交换机不是用户所期望的,此时可以通过配置主备倒换实现将堆叠备交换机升为堆叠主交换机。
除了用户通过命令执行的主备倒换之外,主交换机故障重启也会引起主备倒换。
slave switchover //堆叠主备倒换
堆叠升级
堆叠升级方式有三种:智能升级、传统升级和平滑升级。
智能升级:
堆叠系统或者新的交换机加入堆叠时会自动和主交换机的版本进行同步。
传统升级:
和普通设备升级一样,指定下次启动版本,重启整个堆叠系统进行升级,会造成较长时间的业务中断。
平滑升级:
将堆叠系统划分成为active、backup区域,可以分区域升级,整个堆叠系统的上下采用备份组网,主、备链路分别处于active、backup区域,(先升级backup区域,在升级backup区域时用active区域转发流量,当backup区域升级成功后再升级active区域,在升级active区域时流量通过backup区域来转发)可以实现升级时的业务不中断
跨设备链路聚合Link Aggregation链路聚合LAG
堆叠支持跨设备链路聚合技术,堆叠后为逻辑上的一台交换机,支持Eth-Trunk的成员接口分布在不同的成员交换机上。
当其中一条聚合链路故障或堆叠中某台成员交换机故障时,Eth-Trunk接口通过堆叠线缆将流量重新分布到其他聚合链路上,实现了链路间和设备间的备份,保证了数据流量的可靠传输。
流量本地优先转发
1)链路聚合的负载分担算法根据流量特征将报文分担在不同的成员链路上,对于跨设备链路聚合极有可能出现报文的出接口和入接口不在同一台成员设备之上的情况,此时堆叠成员之间将会通过堆叠线缆转发流量,这增加了堆叠线缆的流量分担,同时也降低了转发效率。
2)为保证流量转发效率、降低堆叠线缆带宽负载,设备可以开启流量本地优先转发,从本设备进入的流量优先从本地转发出去,当本设备无出接口或者出接口全部故障,才会从其他成员交换机的接口转发出去。
华为ENSP模拟器不支持堆叠配置
集群
集群介绍
集群交换机系统CSS(Cluster Switch System),又称为集群,是指将两台支持集群特性的交换机设备组合在一起,从逻辑上虚拟成一台交换设备。
集群与堆叠的区别在于,一般框式交换机堆叠称为集群,盒式交换机称为堆叠,堆叠与集群两者只是叫法和实现有些差异,但是功能是一样的。
集群基本概念
集群中的单台交换机称为集群成员交换机,按照功能不同,可以分为两种角色:
主交换机(Master):主交换机,即Master,负责管理整个集群。
备交换机(Standby):备交换机,即Standby,是主交换机的备份交换机。
集群ID:即CSS ID,用来标识成员交换机,集群中成员交换机的集群ID是唯一的。
CSS Link:集群链路,专门用于组建集群,实现主交换机和备交换机之间数据通信。
集群优先级:即CSS Priority,主要用于角色选举过程中确定成员交换机的角色。优先级值越大优先级越高。
集群控制平面
两台交换机使用集群线缆连接好,分别使能集群功能并完成配置后重启,集群系统会自动建立。
集群系统建立后,在控制平面上,主交换机的主用主控板成为集群系统的控制平面,作为整个系统的管理主角色。备交换机的主用主控板成为集群系统的备用控制面板,作为系统的管理备角色。主交换机和备交换机的备用主控板作为集群系统候选备用主控板。
集群物理连接
根据集群技术发展阶段不同,集群物理连接方式也存在区别:
传统CSS:使用主控板上的集群卡建立集群连接,或者使用业务口建立集群连接。
CSS2:第二代集群交换机系统,专指使用交换网板上的集群卡方式建立集群连接的集群。
传统CSS
1)对于只支持CSS框架的框式交换机,框内接口板之间流量、跨框流量必须经过主控板
2)单框上没有正常工作的主控板时流量无法从一个接口转发到另外一个接口板,同时也无法跨框转发到另一个框。
CSS2
1)支持CSS2构架的框式交换机采用转控分离的构架,单框内接口板之间流量、跨框流量无需经过主控板、集群系统内单台框无能够正常工作的主控板不影响该框的流量转发。
2)CSS2支持任意一个框式交换机内存在一个主控板运行正常,集群的两个框式交换机上的接口板都可以正常转发报文,该特性被称为“集群主控1+N备份”。