液冷革命:AI 时代数据中心的散热新征程
在 AI 芯片功耗大步迈入“千瓦时代”的背景下,数据中心散热领域正经历着一场深刻且意义重大的变革,液冷技术从曾经的“可选项”迅速崛起,成为数据中心的“必选项”。这场由 AI 芯片激烈竞争驱动的变革,正以惊人的速度和规模重塑着全球数据中心散热市场的格局,为国产厂商带来了前所未有的历史性机遇。
一、“热墙”逼近:液冷爆发的必然之势
(一)芯片功耗飙升,机柜功率密度攀升
AI 算力的迅猛增长,使得芯片功耗呈爆炸式上升态势。以英伟达 GPU 产品路线图为例,从 H100 的 700W,到 Blackwell B200 的 1200W,再到预计明年推出的 VR200 的 1800W - 2300W,以及 2027 年可能超过 3600W 的 VR300,直至未来 Feynman 平台可能高达 5000W - 7000W 的功耗,这一系列数据清晰地勾勒出芯片功耗攀升的陡峭曲线。
芯片功耗的急剧增加,直接导致机柜功率密度大幅攀升。一个 GB200 NVL72 机柜功率已达 120 - 140kW,未来 VR300 NVL576 机柜功耗更是有可能超过 600kW,甚至冲击 1MW。如此高的功率密度,对数据中心的散热能力提出了前所未有的挑战。
(二)风冷极限已至,政策推动液冷普及
传统风冷技术,凭借风扇、散热片等组成的计算机房空调(CRACs/CRAHs)系统,在数据中心散热领域长期占据主导地位。然而,当机柜功率密度超过 30 - 40kW 时,风冷因空气导热效率低下的物理特性而达到极限,其效率和经济性难以维持。
与此同时,政策层面也在积极推动液冷技术的普及。中国等国家对数据中心的电能利用效率(PUE)要求日益严格,目标在 2025 年将 PUE 降至 1.3 以下。液冷技术凭借其卓越的节能效果,可将 PUE 降至 1.2 以下,同时具备更低的全生命周期成本(TCO),成为满足政策要求和实现经济效益的必然选择。
(三)液冷优势显著,散热能力远超风冷
液冷技术利用液体远高于空气的比热容和导热性来转移热量,在同等单位下,其散热能力是风冷的 4 - 9 倍。这一显著优势使得液冷技术在应对高功率密度机柜散热问题时,成为风冷技术的理想替代方案。
二、技术路线分化:冷板与 MCL 的双轨发展
(一)冷板式液冷:当前主流,兼容性强
冷板式液冷(DLC)是目前技术最成熟、应用最广泛的液冷方案。冷却液在密封的冷板(内部有微通道的金属板)内流动,冷板紧贴 CPU、GPU 等发热芯片,通过间接接触带走热量。其最大优势在于对现有数据中心架构兼容性强,改造成本相对较低,这使得冷板式液冷在功耗低于 3500W 的应用场景中,仍将是中流砥柱。
尽管市场存在对冷板“商品化”和价格战的担忧,但瑞银报告指出,英伟达的标准化举措虽可能导致 GPU/CPU 冷板价格下降约 50%,但这一下滑将被机柜内其他部件(如 NICs、DPUs)新增的液冷需求所抵消。瑞银分析称,一个完全液冷的 VR200 机柜,其整体冷板价值量相比 GB300 仅下降 1%。报告预测,到 2030 年,冷板市场规模(不含 MCL)将达到 89 亿美元。
(二)微通道盖板(MCL):未来之星,突破热阻
对于功耗超过 3500W 的未来高性能芯片,微通道盖板(MCL)将成为新的标准。MCL 技术将冷却液通道直接集成到芯片的保护盖中,消除了传统方案中的关键热阻层(TIM2),实现了“封装内冷却”。这一创新技术为解决超高功耗芯片的散热问题提供了全新思路。
瑞银大胆预测,MCL 技术最早可能在 2026 年第四季度随超频版的 VR200(2300W)少量采用,并将在功耗达 3600W 的 VR300 上成为主流。东吴证券的报告也认为,对于 Rubin 架构,MCL 方案比相变冷板更具前瞻性,更能适应未来 Rubin Ultra(4000W +)的更高功耗。瑞银预计,MCL 市场规模将在 2027 年达到 12.5 亿美元,2030 年增长至 27 亿美元。
三、超级周期开启:市场规模与价值量双升
(一)市场规模飙升,复合年增长率惊人
瑞银在其报告中给出了一个令人瞩目的预测:全球数据中心直接液体冷却(DLC)市场规模将从 2024 年的 11.38 亿美元,以 51%的复合年增长率(CAGR)飙升至 2030 年的 311.91 亿美元(约合人民币 2205.23 亿元)。这一增长速度远超传统数据中心散热市场,彰显出液冷市场巨大的发展潜力。
(二)单个机柜价值量翻倍,市场构成多元化
这一增长的核心驱动力在于,单个机柜的液冷价值量(DLC content per rack)正在翻倍增长。瑞银的测算显示,一个英伟达 GB200 NVL72 机柜的液冷价值约为 7.4 万美元,而到 2030 年,这一数字预计将翻两番,达到近 40 万美元。东吴证券的测算也印证了价值量提升的趋势,指出从 GB200 升级到 GB300,机架液冷模块的价值量增幅就超过 20%。
瑞银进一步拆分了市场构成,预计到 2030 年,AI 服务器液冷市场将达到 237 亿美元,而非 AI 服务器的液冷市场也将增长至 74 亿美元。这表明,液冷革命正从 AI 领域向整个数据中心行业扩散,为液冷市场的持续增长提供了广阔空间。
四、供应链重塑:国产厂商迎来历史性机遇
(一)英伟达“放权”,供应链格局生变
东吴证券的报告敏锐地捕捉到了英伟达供应链策略的关键变化:从“精装交付”转向“开放生态”。在 A50/H100 时代,英伟达为确保快速交付,对 CDU(冷却液分配单元)等关键部件采取“指定独供”模式,例如维谛(Vertiv)是 GB200 的唯一认证 CDU 供应商。但进入 GB300 及未来的 Rubin 时代,英伟达开始“放权”,仅提供参考设计和接口规范,允许广达、富士康等 ODM(原始设计制造商)在柜外环节自主选择供应商。
这一转变意义重大,它打破了原有封闭的供应体系,为更多具备技术和成本优势的厂商打开了进入英伟达生态的大门。
(二)国产厂商切入路径清晰,市场蛋糕诱人
英伟达供应链策略的转变,为国产供应链厂商提供了两条关键的切入路径。一是二次供应间接进入,国产厂商可以通过为广达、富士康等 ODM 厂商供货,间接进入英伟达的供应链体系;二是一供直接进入,随着国产液冷系统技术成熟度和性价比优势的提升,未来有望作为一级供应商直接进入英伟达的供应商名录。
根据东吴证券的测算,仅 2026 年,ASIC 芯片所需的液冷系统规模就将达到 353 亿元人民币,而英伟达平台所需的液冷系统规模更是高达 697 亿元人民币。这个巨大的市场蛋糕,正因供应链的开放而变得触手可及。
目前,台系 ODM 厂商在 AI 服务器组装中占据主导地位(据摩根士丹利数据,富士康在 GB200 出货中占比约 60%),其在供应链选择上的话语权随之提升。而国产液冷相关企业,如在管路、精密结构件、温控模块等领域已有布局的厂商,正迎来前所未有的历史性机遇,有望在这场千亿级的液冷浪潮中分得一杯羹。
液冷革命正以不可阻挡之势席卷数据中心散热领域,从技术突破到市场规模扩张,再到供应链格局重塑,每一个环节都蕴含着巨大的发展机遇。国产厂商应紧紧抓住这一历史契机,加大技术研发投入,提升产品质量和性价比,积极融入全球供应链体系,在液冷市场的蓝海中实现跨越式发展,共同推动数据中心散热技术迈向新的高度。