AI液冷解决案例-英伟达液冷方案正大规模使用不锈钢波纹管路
其一,Ruby一代实现100%全液冷设计,而GB200、GB300均未达到该比例,且机架内无任何风扇,这一设计代表了业内液冷技术向全液冷发展的整体趋势;
其二,Ruby采用模块化系统结构,回归类似GB200的大母板模组方案——用一块大母板覆盖两个Ruby GPU加一个vivo CPU,形成独立模组,该设计支持快速插拔以节约系统组装时间,液冷不再是单纯的散热解决方案,而是系统集成的一部分,其快接头数量与GB300方案差异较大;
其三,在软管选择上,Ruby液冷方案全面替代了传统PDFE/EPDM橡胶软管,大范围使用不锈钢波纹管,这是与此前方案的显著技术变化。
液冷管路是伺服器液冷系统的核心部件,负责流通工质、分配流量-流阻,并提供外接介面。其主要功能是连接冷板与机柜,将热源排出。目前,管路分为非金属软管(如EPDM、FEP、PTFE)和金属软管两类。
过去,非金属管路占主流,但今年英伟达GB200-GB300 大规模推广不锈钢波纹管,使其成为批量应用方案。
液冷管路对总价值量的影响是什么?
在管路部分,GB200使用传统的PTEPDM软管,成本大约在1000到1500美金;而在GB300上,有两种趋势,一种继续使用波纹管,另一种开始应用不锈钢管,这将使成本增加到2000到3000美金。尽管管路成本相对较少,但在整个液冷系统中占比不多,所以整体业务总价值量大概会从GB200时期的7万到8万美金增长到9万到10万美金,增幅约20%。其中,CDU仍然是成本最高的部分,占比最多,冷板和快接头也分别占据一定比例。
对比EPDM 软管与不锈钢波纹管的优劣
■EPDM 软管高性价比选择,其优势包括极佳柔韧性、轻量化、优异减振能力和低初始成本,便于在空间受限的机箱内安装,并吸收系统震动。然而,缺点明显:耐压能力低、存在冷却液渗透风险、使用寿命较短,长期易老化需频繁维护,且管径粗占用更多空间。适合成本敏感、一般工作负载的液冷场景。
■不锈钢波纹管高性能与可靠性,其优点为极佳耐压耐温、近零渗透率、超长寿命及细管径,提供稳定免维护保障,适用高功率密度伺服器。但代价是高材料成本、低柔韧性、重量大,安装需精确弯曲与焊接,可能传递震动。主要面向追求极致散热、可靠性和空间效率的顶尖应用。
GB300 为何开始批量采用不锈钢波纹管?
1. 承受性EPDM 橡胶在常温或低压下极为柔软、弯曲性能优异,但在持续高压或反覆高压脉动下会发生蠕变与局部鼓胀;金属波纹管本体为金属,承压能力强且弹性回复稳定,特别适合高压/脉动场景。
2. 长期泄漏风险软管通常依靠管夹或压环固定接头,但这些接头在经历温度循环、震动、老化后,可能逐渐松动或失效。即使管身没问题,也容易在接头处发生泄漏。金属管则可透过焊接等方式实现真正的「金属对金属」密封,大幅降低因材料老化或软硬变化导致的泄漏风险(当然仍需避免焊接不良带来的泄漏)。
3. 寿命与总拥有成本(TCO) EPDM 的优势是初期成本低、制造简单。但长期来看,EPDM 寿命较短,可能因老化、泄漏、维护困难带来更多隐性成本。不锈钢波纹管虽初期成本较高,但寿命长、稳定性高、故障率极低,维护需求少。从设备全生命周期与可靠性角度来看,总拥有成本(TCO)反而更低。
4. 布线空间在高密度机箱内,除了液冷管路外,还有大量电源线、讯号线。橡胶管占据空间大,固定时还需额外绑扎夹具,容易与线束绞在一起,拆装与维护极不方便。金属波纹管可做得更细,且弯曲后能保持形状、不易塌陷、不占过多空间,更利于4–8 个冷板并联的复杂路由,让整体布线更整洁、模组化,也便于后续维修与升级。 综合以上各点——高压承受能力、低渗透率、稳定可靠的密封、布线空间高效、总TCO 更低。对于GB300 这种高端、高密度、长寿命要求的伺服器来说,不锈钢波纹管无疑是更「稳妥」、更合适的选择。
- 上一篇:芯片热仿真:从原理到落地的完整指南 2026/1/12
- 下一篇:ABAQUS皮带轮传动仿真 2026/1/9
