高可用设计
本POC环境采用最小化部署,各组件均为单节点。在生产环境中,需要考虑高可用设计以确保业务连续性。本章节对比POC与生产环境的架构差异,为读者提供参考。
POC与生产环境架构对比
域控制器
1台(POC-DC01)
≥ 2台
AD多主复制,任一DC故障不影响认证
SQL Server
1台(POC-SQL01)
2台 + AlwaysOn
SQL AlwaysOn实现数据库故障转移
VMM
1台(POC-VMM01)
2台(主/备)
VMM HA通过SQL AlwaysOn和群集实现
SCOM
1台(POC-OM01)
2台管理服务器
SCOM管理组实现冗余
网络控制器
1节点
3节点
NC使用分布式一致性协议(Raft-like)
SLB MUX
1-2台
≥ 2台
MUX之间Active-Active,BGP ECMP
SDN网关
1台
≥ 2台(网关池)
M+N冗余,自动故障转移
计算节点
2台
≥ 3台(群集)
故障转移群集,实时迁移
存储
本地磁盘
S2D / SAN
Storage Spaces Direct或SAN实现冗余
故障转移群集
在生产环境中,计算节点应组成故障转移群集(Failover Cluster):
群集优势
虚拟机高可用:主机故障时,VM自动迁移到健康节点
实时迁移:维护时零停机迁移虚拟机
群集共享卷:所有节点访问共享存储
群集最低配置
节点数量
≥ 2台(建议3台以上)
共享存储
S2D、iSCSI SAN或FC SAN
网络
独立的心跳网络和管理网络
仲裁
云见证或文件共享见证
Storage Spaces Direct(S2D)
S2D是Windows Server内置的分布式存储解决方案,使用本地磁盘构建高可用存储池:
最少节点
2台(建议4台以上)
磁盘类型
支持NVMe、SSD、HDD的混合配置
数据保护
双副本或三副本镜像,纠删码
性能分层
自动将热数据放在快速介质上
网络控制器高可用
生产环境中NC应部署3个节点:
NC使用类似Raft的分布式一致性协议
3节点中最多可容忍1节点故障
NC节点应分布在不同的物理主机上
SQL Server AlwaysOn
VMM和SCOM的数据库建议使用SQL AlwaysOn可用性组:
主副本处理所有读写操作
辅助副本自动同步数据
主副本故障时自动切换到辅助副本
网络冗余
生产环境的网络设计应考虑:
NIC Team
多网卡绑定,提供链路冗余和带宽聚合
双交换机
上游交换机冗余,消除单点故障
分离网络
管理网络、存储网络、HNV网络使用独立的物理网络
课后习题
为本POC环境设计一个生产级别的架构,列出所需的服务器数量、存储和网络配置。
了解一下Azure Stack HCI,它与本文介绍的SDDC方案有什么异同?
最后更新于