1.
总体目标与前期评估
- 确定目标:可用性SLA、PUE目标、每机柜平均功率(例:12kW/柜)和业务连续时间要求(例:99.99% 年可用性)。
- 负载评估:统计当前与未来3年服务器/存储/网络设备总IT负载(例:初期总IT负载200kW,增长率20%/年)。
- 场地限制:核对办公室机房楼层承重、消防规范、外部供电进线点与通风条件。
- 合规要求:遵循香港电力法规、消防条例与数据保护标准(含机柜间距、出入口疏散通道)。
- 关键设备清单:列出候选UPS、发电机、ATS、PDU、冷源及机柜型号与冗余等级。
2.
冷热通道规划原则与布局设计
- 布局方式:采用冷通道封闭或热通道封闭(推荐冷通道封闭以降低PUE并控制漏冷)。
- 机柜排列:机柜正面对正面,背面对背面,形成冷通道/热通道宽度建议:冷通道1.0m、热通道1.2m。
- 地板与下送风:若使用高架地板,下送风格栅按每排机柜计算风量(例:每12kW柜需约3.5 m3/s冷却风量)。
- 漏风管理:在机柜与地板缝隙、线缆孔处采用封堵,目标冷空气回送效率>90%。
- CFD仿真:实施CFD模拟,验证每个机柜吸入温度≤27°C并评估热点位置。
3.
电力冗余等级与设备选型
- 冗余模型:根据业务重要性选择N+1、2N或2N+1。示例:关键业务采用2N,管理与非关键业务采用N+1。
- UPS方案:模块化在线双变换UPS,单台容量示例:200kVA,系统配置为2N(2台并联),确保10分钟及以上电池支撑用于切换发电机。
- 发电机组:双回路柴油发电机,单台容量示例:500kW,配置为N+1,燃油库存保证至少72小时连续运行(按负载75%计算)。
- 配电设计:A/B双路进线、ATS自动转换开关、壁挂或机架PDU按相位均衡。
- 监控与报警:部署BMS/EMS,实时监控电流、功率因数、温度与油位,并配置SNMP与短信告警。
4.
电力实施与接地、配线细节
- 主干缆与进线:双路市电进线(A/B),电缆规格示例:3相5线铜电缆 3×240mm² + N + PE,需通过变电室至机房配电柜。
- ATS与开关柜:分别为A、B供电侧配置ATS,并在配电柜内设置分段MCCB与AFCI防故障。
- PDU与机柜配电:机柜双PDU(A/B),每PDU额定63A或32A,按机柜功耗分配负载并刻意交叉连接。
- 接地与等电位:整体等电位连接,接地电阻目标≤1Ω,敏感设备另设小阻抗接地。
- 线路标识与冗余测试:所有电缆编号,完成切换、故障注入与载荷切换测试并记录SOP。
5.
制冷、PUE目标与能效优化
- 冷源选择:采用精密空调或行间冷柜,根据机房密度选择水冷或风冷系统(高密度机柜>15kW宜用行间冷柜)。
- PUE目标:设计目标PUE≤1.45(初始),通过冷通道封闭与变频冷机优化可达1.3附近。
- 冷却冗余:使用N+1冷源,关键区配置独立冷源回路。
- 监控与调节:安装温湿度传感器并实现基于实时负载的温度设定(入风温度目标24–27°C)。
- 热回收与节能:评估余热回收可能性(办公采暖或热水),并使用智能冷却策略降低能耗。
6.
网络、CDN与DDoS防御的协同设计
- 带宽与多线接入:至少两家ISP异地接入,BGP多线冗余,初始带宽例如2×10Gbps。
- 边界防护:部署硬件防火墙 + DDoS清洗服务,重要域名指向CDN加速节点以分散流量。
- CDN策略:关键静态资源上CDN,动态接口通过智能路由与WAF进行保护,减轻源站负载。
- DDoS应急:与清洗中心签订SLA(清洗时延<5分钟,清洗能力≥200Gbps)。
- 日常运维:配置NetFlow与流量告警,定期演练流量突发与切换手册。
7.
示例服务器配置与真实案例
- 示例配置表(单机柜10U密度示范,单台功耗为例):
| 机柜/设备 | 型号 | CPU | 内存 | 存储 | 平均功耗 |
| Rack-01 ServerA | Dell R650 | 2×Intel Gold 6338 (32C) | 256GB | 2×1.92TB NVMe | 850W |
| Rack-01 ServerB | HPE DL380 | 2×Intel Silver 4310 | 128GB | 4×1TB SSD | 650W |
| Top-of-Rack Switch | Cisco Nexus 93180YC | — | — | — | 300W |
- 真实案例:某香港金融客户在中心城区部署,初期40机柜、平均12kW/柜,总IT负载约480kW;采用2N UPS(2×300kVA)、发电机两台500kW N+1、冷通道封闭后PUE由1.6降至1.35。
- 效果数据:完成冗余后三个月内未发生主电源引起的业务中断,DDoS事件中使用CDN+清洗中心成功吸收120Gbps攻击并将源站流量控制在可承受范围。
- 验证与交付:完成切换测试、发电机满载测试、UPS放电测试与CFD验证后移交,配套运维手册与应急SOP齐备。
- 维护建议:每年进行一次发电机负载测试、季度UPS健康检查与每月冷却效率评估,并保留关键备件库存。
来源:香港机房办公室冷热通道规划与电力冗余设计落地实施步骤