科特网 弱电·智能建筑·安防工程数字化平台 行业资讯 B2B商城

液冷不会超越其高密度利基市场

发布时间:2026-05-18 | 分类:行业洞察
液冷不会超越其高密度利基市场

示</p>
<p><img src="https://www.complote.com/api/uploads/news/images/d057056676534a17a502d1fa8194b90a.jpg" alt="示意图" loading="lazy" class="oc-md-img" /></p>
<p>意图

直接液冷(DLC,包括冷板式和浸没式系统)的部署仍然高度集中在空气冷却已不再可行的应用领域。随着一波 AI 基础设施的兴建,DLC 制造商将工程资源集中于最大化高性能 IT(即 AI 训练硬件)的冷却性能。相比之下,DLC 制造商在解决阻碍 DLC 在优先级不同的 IT 应用中采用的运维问题方面,几乎没有投入精力。

尽管 DLC 在性能和效率方面有优势,但它不太可能在 3 年内实现真正的主流普及。具体而言,大多数运营商不会在其关键任务应用中大规模部署 DLC。这些应用缺乏高密度化的动力,而弹性设计和数据中心运维方面的持续困难严重削弱了 DLC 的商业价值。

即使 DLC 制造商在扩大规模(或被大型数据中心厂商收购),其用于定制下一代冷却产品的资源仍然是有限的。只要高密度 AI 训练数据中心的建设继续推进,它就会引导 DLC 的设计优先级远离高弹性(通常较低密度)业务应用的需求。

DLC 在扩大的范围内发展

2026 年,DLC 仍然局限于超算及类似应用的"利基"领域——尽管生成式 AI 训练的崛起显著扩展了这一领域,并使 DLC 进入了更多设施。

生成式 AI 训练本质上是一种超算形式,正是这些共同特征使生成式 AI 成为 DLC 的天然适配场景。AI 训练作业会运行至完成,无需实时用户输入,与批处理计算类似。单个计算节点的故障甚至重启训练通常不会立即造成经济损失,因为收入通常来自后续的推理应用。

与 AI 训练和高性能计算(HPC)硬件相比,支持业务关键型应用(如数据库)的 IT 通常具有较低的热密度和更高的弹性目标。在这里,DLC 面临双重挑战:液冷通常需要更复杂且更昂贵的方案才能实现高标准弹性;而主流 IT 应用往往缺乏高密度化的紧迫需求。

通过人为错误、计划内维护和设备故障等事件维持应用正常运行,通常依赖于冗余的冷却设备。空气冷却设备将设施空气同时作为热汇和冗余空调或空气处理机的共享接口。相比之下,DLC 将设施基础设施与 IT 紧密耦合(例如浸没槽或冷板的管道连接)。连接冗余 CDU 或歧管的管道和阀门需要精心设计和操作,切换设备可能引起难以建模和预测的湍流效应。

液体冷却剂的体积也远小于数据大厅中的空气体积,这意味着停电后备用发电机启动并接管冷却负载的缓冲时间更短。可接受的穿越时间(ride-through time)至少需要 UPS 为 CDU 水泵供电——而设施设备配备 UPS 仍然不常见。行业在 DLC 组件的所有权和运维划分方面(设施团队与 IT 团队之间)也缺乏统一共识。

上述问题对数据中心运营商来说是一个持续性的担忧,即使在需要高密度化 IT 以提升性能的应用(如 HPC)中也是如此。在将应用和 IT 进行规划时,组织会权衡高密度化的利弊。较低密度的 IT 更有可能在现有数据大厅空间中找到容身之处,通常也能在新建数据中心中带来更可预测和更熟悉的基础设施设计条件。

许多实时服务用户请求的关键任务应用,没有从部署高功率处理器和密集机架中显示出明确的投资回报。使用传统(较低)处理器功耗和工作能力的 IT 来运行这些应用,可以使受单个服务器故障(因冷却或其他原因)影响的工作负载比例最小化。这类 IT 往往趋向于较低的利用率,以留出应对峰值需求的余量。在高性能液冷 IT 上以高利用率和强弹性运行这些应用,将产生冗余 DLC 的设备与工程成本,或软件弹性替代方案的成本。

投资强化了现有优先级

对传统、较低密度数据中心空间的需求持续增长,与生成式 AI 热潮并存,但受到的关注远远不及。在未来 3 年及更长时间内,数据中心运营商将同时建设用于 AI 训练的高密度空间和托管关键任务应用的常规数据大厅。总体而言,对生成式 AI 的投资不太可能从传统数据中心中抽走资金,因为这些数据中心拥有成熟的商业模式和坚实的增长预期。

然而,DLC 制造商的工程和生产能力是有限的,在未来几年内,它们很可能继续专注于与 DLC 当前设计优先级一致的高增长 AI 和 HPC 应用。生成式 AI 应用产生了足够的液冷需求,足以让主要 DLC 制造商保持订单饱满。随着产能持续扩大,DLC 制造商通过不断提高产品在该领域的最大冷却性能和适配性,能获得更多收益——因为这代表了它们今天的大部分收入。

相比之下,为高标准弹性重新设计 DLC 以解决日常运维中的复杂问题,似乎是一个困难命题,商业前景也远不明确。即使 DLC 制造商投入工程资源来优化冗余液冷系统的设计和运维(这很可能让最终用户承担更高成本),关键任务 IT 的运营者是否会接受它仍不明朗——尤其是在缺乏高密度化意愿的情况下。

DLC 制造商在未来几年将蓬勃发展并创下销售纪录。然而,DLC 在整个行业中更广泛的应用将仍然难以实现,直到关键任务应用形成比热密度更强烈的驱动因素。

从长期来看,DLC 的能效潜力可能变得更加重要——特别是在电网约束激励最大化 IT 用电比例的情况下,或当立法介入以塑造这一决策过程时。IT 高密度化并非命中注定,DLC 制造商可能需要站在更长远的角度,为未来应用争取更有利的成本/效益比。生成式 AI 训练的建设不会无限期升级,训练模型的速度优势也不会永远保持今天的重要地位。一些组织(特别是在预训练基础模型之上进行增量训练的组织)可能会在较低密度的集群上进行训练,接受模型规模或训练速度上的一定限制。2025 年初 DeepSeek 的发布——在较低密度硬件上训练却取得了有竞争力的结果——表明进一步的软件创新可以为无节制的高密度化提供替代方案。

Uptime 观点

DLC 现在的部署和投资比以往任何时候都多——但它仍然服务于 IT 中一个特定的子集。超算和 HPC 推动了当今 DLC 设计的发展,而 AI 训练则提供了一个现成的增长机会,且几乎不需要改变设计优先级。

总体而言,数据中心的投资和建设似乎几乎是无限的,但 DLC 的制造产能和工程资源是有限的。机架密度和高热流密度仍然是 DLC 迄今最强的驱动力——在广泛应用形成更强的 DLC 驱动力之前,真正的主流普及仍将难以实现。