新建看上限,改造看落地:两相液冷如何兼顾未来与现实?
来源:塔能 | 作者:小编 | 发布时间: 2026-05-12 21:01:57 | 次浏览


新建看上限,改造看落地:两相液冷如何兼顾未来与现实?

 

作者:两相君

常见问题(FAQ)

Q: 新建智算中心采用两相液冷,初始投资比单相高多少?


A: 初始设备成本约高15-25%,但考虑更高机柜密度、更低PUE和更长寿命,整体TCO通常更低,投资回收期约1.5-2年。

 

Q: 两相液冷能在全年不使用压缩机吗?


A: 在室外温度低于芯片工作温度(如15℃以下)时可完全自然冷却。在温暖地区,可能需要辅助冷却但压缩机使用时间大幅减少。

 

Q: CLF 0.036是什么意思?


A: 冷却负载因子(CLF)= 冷却系统功耗 / IT设备功耗。0.036表示冷却功耗仅为IT功耗的3.6%,即每1000W IT设备只需36W用于散热。




摘要

AI算力密度持续攀升,单机柜功率已突破30kW甚至60kW,传统风冷与单相液冷逼近能力边界。热管理的目标正从“降温”进化为“控温”——±5℃以上的瞬时波动即可使推理延迟增加15%-20%。两相液冷利用相变潜热原理,实现±1.5℃以内的精准控温,显著消除热降频风险。从新建智算中心到存量机房改造,两相液冷兼顾未来上限与现实落地,让算力真正兑现。




正文

 

 

image.png 

 

 

 

一、行业正在经历一场静默的升级:算力密度飙升,热管理边界被不断挑战

1. AI训练集群推动机柜功率突破临界点:据DCD数据,2024年起国内头部智算中心已有超过30%的机柜功率突破30kW,部分达60-120kW。传统的风冷与单相液冷难以维持温度稳定。

2. 温区波动正成为算力释放的隐形瓶颈:即便平均温度可控,±5℃以上瞬时波动仍会使AI推理任务延迟增加15%-20%。“不超温”不等于“能稳跑”。

3. 存量机房改造需求集中爆发:“东数西算”推进下,大量老旧机房受限于原有冷却架构,客户不再问“能不能装”,而是问“能不能长期满载运行”。

 

 

image.png 

 

 

 

二、行业的真实困境:热管理不再是技术选择题,而是运营生存题

1. 单相液冷正在接近能力边界:面对600W以上GPU芯片,需大幅提升流速,导致泵耗激增、管路承压加大,无法从根本上抑制瞬时跳变。

2. 改造风险远超预期:需同步更换配电、防水、监控,周期长达数月。一旦泄漏,业务中断损失放大。

3. 节能指标与算力目标难以兼顾:为达标PUE 1.3,有时被迫牺牲算力密度。

 

三、真正值得被关注的解决方案:以精准控温为核心的新一代热管理体系

1. 两相液冷的本质是“相变控温”:极少量工质即可带走大量热量,冷板温度几乎恒定,实现±1.5℃以内控制精度。

2. 航天级技术下放:封闭式微通道设计、惰性工质封装,经长周期验证。

3. “硬件+平台”协同:接入物联网SaaS平台,实现温度、压力、流量、相变状态的实时监测与动态优化,主动干预运行质量。

 

image.png 

 

 

 

四、这场变革带来的不仅是技术升级,更是算力运营范式的重构

· 新建智算中心:可在设计阶段锁定120kW+/机柜扩展能力,全年PUE稳定在1.12以下,pPUE局部可达1.05。

· 存量机房改造:模块化背板支持在线部署。江西某改造项目(数据已脱敏)中,15kW机柜PUE由1.8降至1.196,CLF低至0.036,释放30%以上潜在算力。

· 最终价值回归到“算力兑现率”与“运营总成本”:两相液冷通过减少热降频、延长设备寿命、降低冷却能耗、提升机柜利用率,全面优化TCO。

 

当单相液冷开始接近能力边界,航天级两相液冷用精准控温接住下一代高密度算力——不止降温,更能稳算力、降能耗、可运营。两相液冷 + 物联网精准节能平台:让每一瓦算力都释放得稳、省、可控。

 

免责声明:本文数据基于塔能内部测试及行业公开信息,具体效果因环境而异。