1. 概览:目标与设计原则
在
香港站群机房中,目标是实现连续供电与稳定温湿度。实践原则包括分区冗余(N+1或2N)、多条路径配电、冷热通道管理、及时监控与可执行的应急流程。以下内容提供从设计到日常操作的逐步实施指南。
2. 选择电力冗余拓扑
步骤:1) 评估负载峰值与增长预测(用PUE和IT设备TDP计算)2) 决定拓扑:小型站群常用N+1;核心需要2N;边缘可用N或N+1 3) 计算单台UPS与发电机容量,留20%余量 4) 绘制单线图,标注ATS、PDU、回路和母线分布。
3. UPS系统安装与配置步骤
准备:确认入场空间、散热、地线与轨道。操作步骤:1) 按厂商手册就位并固定机架2) 连接直流电池柜(注意极性)3) 配置并联或分布式拓扑(并联系统需同步通讯线)4) 设置报警门限(电压、频率、负载)5) 逐台带载投运并记录波形。
4. UPS电池维护与放电测试
步骤:1) 断电前通知相关方并执行停机窗口2) 按LOTO(锁定挂签)程序隔离回路3) 进行浮充电压记录、比重或电池内阻测试4) 安排放电测试:连接放电负载或使用放电仪,记录放电时间到终止电压5) 根据结果判断是否更换电池并做清单。
5. 发电机选型与并网测试
步骤:1) 选择柴油/天然气发电机,容量按最大负载+30%冗余2) 安装燃油、排气与冷却系统并做防火防噪处理3) 做空载启动、满载测试与负载接入测试(用负载箱或逐步接入PDU)4) 记录启动时间、频率恢复时间、燃油消耗并调整燃油策略。
6. 自动转换开关(ATS)配置与测试
步骤:1) 确认ATS类型(静态/机械)2) 按单线图正确接线并标记相序3) 设置转移延时与返转条件(防止频繁切换)4) 模拟断电测试:断开市电,观察ATS是否在设定时间内切换并上闭合发电机输出5) 做反向测试并记录。
7. 配电与PDU布署实操
步骤:1) 按负载优先级设定PDU分区(核心、一般、管理)2) 每条回路做过载保护与漏电保护3) 标识电缆与回路,留足弯曲半径并固定4) 配置远程电流/电压监控模块,设置告警阈值并与NMS/BMS集成。
8. 冷却系统总体设计与容量计算
步骤:1) 计算IT总热负荷(W)=设备功率×利用系数2) 确定目标入口温度(一般22±2℃)和机房PUE目标3) 选择CRAC/精密空调或冷水机组,容量按热负荷×(1+冗余率)4) 设计冷却回路与冷冻水泵冗余(常用N+1)。
9. CRAC/冷水机组的安装与调试
步骤:1) 就位并固定设备,连接冷冻水或冷媒管路2) 冲洗管路、排气、加注防冻液3) 配置定温定湿控制器,设定回风与送风温差4) 逐台调试,实现温度曲线达标并记录能耗数据。
10. 热通道/冷通道布置与风管管理
步骤:1) 采用冷热通道分离,机柜背对背布列2) 安装地板格栅与挡板,封堵缝隙3) 如有必要,建设热通道封闭或冷通道封闭系统,安装门与密封条4) 使用风速计和温度探头调平风量,确保服务器进风温度一致。
11. 环境监测与BMS集成
步骤:1) 部署温湿度、漏水、烟雾、门禁、电力监测传感器2) 选择支持SNMP/Modbus的探头并接入BMS/NMS3) 配置报警策略、短信/邮件通知与自动化工单4) 定期校准传感器并保存历史数据以便趋势分析。
12. 日常巡检清单与周期
制定:每日观测UPS/发电机运行状态、机房温湿度、门禁与报警日志;每周检查燃油油位、冷冻水泵振动与滤网;每月进行负载分配检查;每季度做一次UPS放电测试与发电机满载演练;每年做全面电气检测和热成像。
13. 紧急切换与故障处理标准操作
步骤:1) 明确停电和降级流程并培训值班人员2) 执行LOTO并逐步切换负载3) 如UPS掉线,立即启动发电机并人工/自动切换回路4) 记录事件时间线并在事件后做根因分析与改进措施。
14. 工具与物资清单
常备:万用表、红外热像仪、电流钳、放电测试仪、备用电池包、常用备件(风扇、泵、继电器)、应急燃油、修复工具包与个人防护装备(绝缘手套、安全带)。
15. 安全与合规要点
执行:严格LOTO、遵守本地电气规范与消防条例、定期培训、做到燃油与烟囱排放合规、关键设备冗余满足合同SLA要求并保留检测记录以备审计。
16. 性能优化与节能建议
建议:采用冷通道封闭、提高进风温度设定(合理放宽到26℃以节能)、使用热回收、优化负载均衡与分段启停空调、引入变频泵与节能控制策略并监测PUE变化。
17. 常见故障案例与处理示例
示例:若UPS频繁切换,检查输入电源质量、旁路继电器及电池健康;若冷却不足,测量冷冻水差温、检查泵速与阀门位置并清洁过滤器;若发电机启动失败,排查燃油供应与启动电池电压。
18. 文档与培训建议
建立SOP、单线图、应急流程、设备保养记录与培训手册;定期演练并更新文档,确保交接班时值班人员清楚应对步骤。
19. 问:如何在不影响业务的情况下测试发电机与ATS?
答:选择低峰维护窗口,提前通知客户,采用旁路或分段切换,把非关键负载先移除,用负载箱或分段接入验证,严格按LOTO流程进行并由专人监护。
20. 问:UPS电池何时必须更换,如何判断?
答:以放电容量下降到额定容量的80%或内部电阻明显上升并伴随温升为更换触发条件;通过定期放电测试、内阻测量与厂商寿命预测来决定,必要时提前采购替换。
21. 问:在香港潮湿环境下,机房冷却与防潮有哪些实操要点?
答:控制机房相对湿度在40–60%;使用除湿功能的CRAC或独立除湿机;确保冷凝水排放畅通、地板下防潮层完好;设备间保持适当通风并定期检查漏水探测器。