数据中心不断演进以满足 AI 的巨大电力需求
2025年11月28日 17:09 发布者:eechina
作者:德州仪器随着大型语言模型彻底改变我们访问数据的方式,人工智能 (AI) 的进步正在颠覆各行各业及社会对数据中心计算资源的运用模式。我们正逐步进入能够直接向 AI 提问并获取详尽答案的时代,这与向真人提问无异,而非仅仅在搜索引擎中输入特定关键词。当然,这仅是 AI 能力的冰山一角。AI 还能编写代码、生成图像和视频、完成会议记录与纪要。为实现所有这些 AI 功能,需要的电力急剧攀升。
要提供如此大的电力并确保 AI 能够充分发挥其潜力,需要重新构想数据中心的 IT 服务器机架结构,以及获取与输送电力的最佳方式。本文将深入探讨三个核心议题:数据中心如何获取电力并输送至执行计算任务的服务器功能;为何必须改变配电架构才能满足快速演进的 AI 计算与电力需求;以及如何实现这种变革。
图 1 展示了 IT 服务器机架级电力需求随时间的变化趋势。图 1 预计,到 2028 年单个 IT 机架将需要 1.5MW 的电力,这是当前服务器机架所消耗电力的 10 倍。

图 1. 机架级电力需求
演进简史
为理解数据中心与服务器内电力输送网络所发生的巨大变革,我们有必要先回顾一下当前的架构。图 2 所示为第一代配电架构,自 20 世纪 90 年代至今,该架构一直在服务器和数据中心领域占据主导地位。图 2 的左上区域为来自交流电网的三相交流电。此电力通过变压器从约 13kV 的“中压”降为 480V 交流线电压。不间断电源 (UPS) 为此电压提供缓冲。
当交流电网断电时,UPS 利用本地蓄电池和逆变器功能维持数据中心服务器的运行,直至自动转换开关 (ATS) 或静态转换开关 (STS) 启动备用发电机接管供电。480V 交流线电压相当于 277VAC 相电压。
将 277VAC 的三相电力输送至 IT 服务器机架后,电源单元 (PSU) 将执行功率因数校正 (PFC) 并生成稳定的 12V 输出,以便分配至服务器 IT 托盘。这种 12V 配电电压适用于第一代架构,为各种负载、电压稳压器和其他负载点稳压器 (PoL) 供电,产生电压以为整个服务器托盘中使用的处理器、存储器和通信集成电路供电。当总机架功率约为 10kW 至 20kW 时,这种架构运行良好。然而,随着对更高计算能力的需求增加,支撑这些计算功能所需的电力也在增加。

图 2. 第一代传统机架服务器
图 3 展示了数据中心配电架构的下一次演进。从图 3 的左上区域可见,此架构起始于相同的中压输入电源。与第一代架构类似,变压器将三相 13kV 转换为 480VAC 线电压。此架构不再采用 UPS,而是将等效的 277VAC 相电压直接输送至 IT 机架内部的本地 PSU。这些 PSU 不再专用于每个服务器托盘,而是整合在统一的电源架中。在此背景下,电源架本质就是一组电源,其输出共同承担 IT 设备的负载需求。
N+1 配置中的每个电源架通常包含六个 PSU,以实现冗余。可通过添加电源架来满足 IT 机架的总电力需求。这些电源架输出 50VDC 总线电压,通过沿服务器机架背面铺设的大电流汇流排分配至各个 IT 托盘。一些第二代装置保留了 UPS 功能,而其他装置会将其移除(如图 3 所示)并替换为本地电池备份单元 (BBU),使 50VDC 总线维持供电,直至电源恢复或备用发电机接管供电。在某些情况下,电容器架或电容器备用单元 (CBU) 有助于消除与任何电源中断相关的过大电压瞬变和电流瞬变。每个 IT 托盘内的 50V 总线连接到本地中间总线转换器,产生为 IT 托盘中系统负载供电所需的 12V 电压。

图 3. 第二代 — 云与 AI 计算
第二代架构使 IT 机架负载能力突破第一代架构限制,实际负载可达 100kW 级别。一旦所需的总功率开始达到 200kW 左右,配电损耗就会显著增加,导致进一步提升功率变得不切实际。
AI 数据中心电力输送
负责运行高级 AI 模型的数据中心机架预计在 2028 年前突破 1MW 功率。假设汇流条电压为 50V,在第二代架构中配送这一功率需要产生 20,000A 的电流。输送如此大电流所需的汇流条将会很重、成本高昂且不切实际。因此,新型 AI IT 服务器机架采用 800VDC 或 ±400VDC 的更高电压总线进行配电,可以将汇流排的大电流要求从 20kA 降低到 1.25kA。这种量级的电流降低将有助于保持较高的整体电力输送效率,并支持使用体积更小、密度更低的铜汇流排。图 4 展示了这一架构。
第二代架构的电源架被侧装式电源舱取代,侧装式电源舱将三相 480VAC 电网电压作为其输入。侧装式电源舱将此输入转换为 800VDC 或 ±400VDC 总线电压并配送到一个或多个 IT 服务器机架。侧装式电源舱现在还包括 BBU。除了提高配电效率,第三代架构还在 IT 机架中为计算功能提供了更多空间。
从某种意义上讲,提升 IT 服务器机架的计算密度比解决配电问题更为关键。为了让 AI 发挥最佳功能,基于 AI 的 IT 机架会使用数百个处理器来快速处理所需的计算量。这些处理器需要能够在高密度的封装空间中相互通信。从 IT 机架中移除大部分电源转换功能后,可以在更小的空间内安装更多的处理器。现在,机架中的每个 IT 托盘都以此 800VDC 或 ±400VDC 总线电压作为输入。然后,托盘中的中间总线转换器将该电压转换为 IT 托盘上的配电电压。根据所选架构,配电电压可以是 48V、12V 甚至 6V。

图 4. 第三代 — AI 计算直流配电侧装式电源舱
未来将如何发展?
尽管第三代架构可以提升配电效率并显著增加 IT 机架内的计算密度,但这样做的代价是会占用数据中心 IT 机房的更多空间。因此,数据中心演进的下一步是将侧装式电源舱的 AC/DC 电源转换功能从 IT 机房迁移至配电室。
图 5 展示了第四代架构的规划方案。在此架构中,侧装式电源舱保留 BBU 功能,而 AC/DC 转换功能则移入固态变压器 (SST)。第一、二、三代架构的输入电压均为电网提供的 13kV 中压。该电压被变压为三相 480VAC 配电总线电压,然后转换为直流配电总线电压。SST 同时取代了 13kV 变压器和 480VDC 至 800VDC 或 ±400VDC 电源转换环节。SST 在单个电力转换阶段实现 PFC 功能、电压降压和直流转换。备用发电机现在需要连接至中压节点,或通过 AC/DC 转换器接入 SST 输出端。最终实现了更高效的配电网络,并为 IT 机房腾出更多计算空间。

图 5 . 第四代 — AI 计算 SST 与直流配电
实现愿景的技术支撑
每一代配电架构都需要大量的精密电源转换功能。这些功能包括 PFC、800VDC 或 ±400VDC DC/DC 转换、二极管 ORing、均流、热插拔、保护、控制及功率计量。先进半导体技术是确保各项功能实现极致性能与效率的关键。例如:
• 执行 PFC 并生成直流总线电压需要实时微控制器。
• 实现电感器-电感器-电容器 (LLC) 和 PFC 等拓扑需要高效的宽带隙半导体开关。
• 支持功率计量、控制与保护需要精确的电流和电压检测。
• 为系统内各种隔离式开关供电需要小尺寸、高效的偏置电源和栅极驱动器。
结语
AI 正在改变我们与信息和数据的交互方式。为了满足电力转换需求,数据中心亟需新型配电架构。本系列的后续文章将深入解析 PSU,探讨储能,分析中间总线转换器与电压稳压器的发展趋势,以及阐释支撑这些功能的主要技术和半导体解决方案。
