高可用设计

本POC环境采用最小化部署,各组件均为单节点。在生产环境中,需要考虑高可用设计以确保业务连续性。本章节对比POC与生产环境的架构差异,为读者提供参考。

POC与生产环境架构对比

组件
POC部署
生产环境建议
高可用原理

域控制器

1台(POC-DC01)

≥ 2台

AD多主复制,任一DC故障不影响认证

SQL Server

1台(POC-SQL01)

2台 + AlwaysOn

SQL AlwaysOn实现数据库故障转移

VMM

1台(POC-VMM01)

2台(主/备)

VMM HA通过SQL AlwaysOn和群集实现

SCOM

1台(POC-OM01)

2台管理服务器

SCOM管理组实现冗余

网络控制器

1节点

3节点

NC使用分布式一致性协议(Raft-like)

SLB MUX

1-2台

≥ 2台

MUX之间Active-Active,BGP ECMP

SDN网关

1台

≥ 2台(网关池)

M+N冗余,自动故障转移

计算节点

2台

≥ 3台(群集)

故障转移群集,实时迁移

存储

本地磁盘

S2D / SAN

Storage Spaces Direct或SAN实现冗余

故障转移群集

在生产环境中,计算节点应组成故障转移群集(Failover Cluster):

群集优势

  • 虚拟机高可用:主机故障时,VM自动迁移到健康节点

  • 实时迁移:维护时零停机迁移虚拟机

  • 群集共享卷:所有节点访问共享存储

群集最低配置

配置项
要求

节点数量

≥ 2台(建议3台以上)

共享存储

S2D、iSCSI SAN或FC SAN

网络

独立的心跳网络和管理网络

仲裁

云见证或文件共享见证

Storage Spaces Direct(S2D)

S2D是Windows Server内置的分布式存储解决方案,使用本地磁盘构建高可用存储池:

特性
说明

最少节点

2台(建议4台以上)

磁盘类型

支持NVMe、SSD、HDD的混合配置

数据保护

双副本或三副本镜像,纠删码

性能分层

自动将热数据放在快速介质上

网络控制器高可用

生产环境中NC应部署3个节点:

  • NC使用类似Raft的分布式一致性协议

  • 3节点中最多可容忍1节点故障

  • NC节点应分布在不同的物理主机上

SQL Server AlwaysOn

VMM和SCOM的数据库建议使用SQL AlwaysOn可用性组:

  • 主副本处理所有读写操作

  • 辅助副本自动同步数据

  • 主副本故障时自动切换到辅助副本

网络冗余

生产环境的网络设计应考虑:

设计
说明

NIC Team

多网卡绑定,提供链路冗余和带宽聚合

双交换机

上游交换机冗余,消除单点故障

分离网络

管理网络、存储网络、HNV网络使用独立的物理网络

课后习题

  • 为本POC环境设计一个生产级别的架构,列出所需的服务器数量、存储和网络配置。

  • 了解一下Azure Stack HCI,它与本文介绍的SDDC方案有什么异同?

最后更新于