文章
“人工智能”的一个定义是模仿并生成类人行为的软件。这是否可取是一个有争议的话题,许多人更希望我们周围的机器和自动化服务做出有保证的理性和确定性的反应。然而,人工智能将继续存在,并且在云的支持下,它代表着一项2022年价值约1.36亿美元的业务,根据Grand View Research[1]的数据,预计到2030年将增至近2万亿美元。人工智能的一个重要功能是最大限度地减少家庭和工业中的能源消耗,但人工智能计算本身在“学习”阶段和日常使用中都会消耗大量的电力。因此,最大的数据中心需要超过100MW的馈送,这意味着通过由此产生的碳足迹,以美元和环境为单位的成本很高。我们正在考虑人工智能,但当然其他增加的负担包括加密货币挖矿、物联网和社交媒体/流媒体。
一个成功的例子是,与不断膨胀的数据吞吐量相比,数据中心的能耗增长相对缓慢,这在很大程度上是由于硬件及其电源的能效不断提高。然而,据说人工智能对机架功率密度的要求是传统数据中心功能的3倍,而且进一步提高效率越来越难以实现。因此,系统设计者不断地重新审视他们的电力传输架构,以寻找在将公用事业交流转换到GPU、CPU、FPGA和ASIC通常需要的低于1V的直流电平的过程中提高效率的方法。一个成功的故事是,与不断膨胀的数据吞吐量相比,数据中心的能源消耗增长相对较慢,这主要是由于硬件及其电源的能源效率不断提高。然而,据说人工智能的机架功率密度要求比传统数据中心功能高3倍,进一步的效率提升变得越来越难以实现。因此,系统设计人员不断重新审视其供电架构,以寻找在将市电交流电转换为 GPU、CPU、FPGA 和 ASIC 通常需要的低于 1V 直流电平的过程中提高效率的方法。
机架电源架构的演变
机架电源架构的演变
在设计数据中心的配电架构时,需要考虑许多因素。其中包括配电和转换中的安全和损耗考虑的电压和电流水平,功能和/或安全隔离的需要,功率转换级的物理尺寸,冷却安排,在哪里以及是否需要严格的电压调节,当然还有成本。这些年来,所有这些因素的重点都发生了变化,随着电力水平的提高,最佳安排也发生了变化。当负载相对较低,模拟和接口电路的端电压为12V或5V,可能为-12V时,为每个具有多个直流输出的机架架配备一个AC/DC转换器是可行的,图1(左)。这种布置的布线体积庞大且昂贵,且具有必要的安全隔离,备份只能通过前面的UPS进行,并且在每个机框中复制AC/DC功能也很昂贵。随着负载的增加,一个合乎逻辑的进展是为机柜配备一个大容量AC/DC转换器,可能有冗余,然后通过母线将DC路由到每个机框,如图1(右)所示。这最初是在12V,但48VDC变得很常见,以保持低电流和减少16x的欧姆损耗,但仍然处于“安全”电压,也允许更容易地集成48V电池作为备份。然后,每个刀片都需要将48V下转换为端电压,这通常是通过隔离、调节的中间总线转换器将其转换为12V,然后通过非隔离、固定输入的“负载点”(PoL)转换器将其下转换为芯片级电压。
图 1:数据中心机架电源架构演变
“当前”做法
随着功率水平的不断提高,现在人工智能应用中每个机架的功率通常为30kW[2],转换的功率密度变得越来越重要,因此人们越来越重视效率,而且越来越重视DC/DC的“瓦/立方英寸”规格,以及易于散热的矛盾需求。这导致了使用具有固定转换比和无隔离的中间总线转换器DC/DC的方法,这对于给定的功率输出产生了最高的效率、最小的尺寸和最低的成本。在没有隔离的情况下,必须管理公共接地路径,但这并不是配电范围有限的主要问题。以下PoL转换器现在必须具有更宽的输入范围,因为它们的电源与48V总线的比例是固定的,总线转换器的比例可以从4:1(48V到12V)、6:1(48V-8V)或8:1(48V/6V)的典型值中选择,以适应PoL转换器的峰值效率“最佳点”。较低的转换比和较高的PoL电源电压导致较低的总线电流和较低的PCB连接损耗,而PoL通常在来自较高总线转换器比的较低输入电压下更有效。柔性电源模块[3]率先推出的另一种选择是其“混合调节比(HRR)方案[4]”,其中总线转换器不调节到一定的输入电压,高于该输入电压,输出被调节。这将总体输入电压变化减少到以下PoL,从而允许使用更有效的类型。48V过电压瞬变也被防止通过转换器,从而提高了可靠性并降低了PoL的峰值额定电压要求。
系统注意事项很重要
机架式电源架构的主要目标是高转换效率和功率密度,但也应采取“整体”观点:例如,主动冷却是一个主要成本,消耗功率本身,如果主要系统耗散在刀片上的转换器中,则必须考虑散热途径。针对顶侧冷却进行优化的薄型总线转换器在这方面是有利的,允许通过附接的冷板或散热器利用吹送空气甚至液体冷却来提取热量。
在更高的功率下,互连中的损耗可能是巨大的,并且在48V下通过母线的初始分配是备用电池中的安全性、功耗和易耦合性之间的良好折衷。在接近末端IC负载的情况下,电流可能达到其最高值,通常为100A以上,这可能会在PCB跟踪中产生高耗散功率。如果PoL真的不直接在负载上,电压也会下降,因此将PoL转换器功率和控制级拆分为单独硬件的方案可能是一种有用的方法。例如,PWM控制IC可以直接安装在耗电设备下方,以非常精确地感测和控制电压,而功率级可以是板顶侧的模块,与端负载相邻。
最佳架构设计还将考虑功率转换的连续、最小和可能的峰值负载及其持续时间。中间总线转换器和PoL的功率输出将具有“热”额定值,限制了长期耗散和内部温度上升,但计算负载在“睡眠”、运行和峰值功耗之间的比例可能很高。如果这些值是已知的,并且不同的功率转换级具有浪涌电流额定值,则转换器可以比额定为连续提供峰值功率的转换器更小并且成本更低。具有低至轻负载的“平坦”效率曲线的转换器也有利于利用负载睡眠或空闲模式的较低系统耗散目标。
一些示例解决方案
Flex 电源模块 BMR313 部件(图 2,左)是具有高峰值功率能力的 4:1 比率、非隔离和未稳压中间总线转换器的示例。它是与安森美合作开发的,在行业标准的LGA封装中,在超紧凑的封装中具有1kW的连续额定功率,仅为23.4 x 17.8 x 7.65mm。然而,峰值功率能力为 3kW,可实现令人印象深刻的 15kW/in3 浪涌额定值。输入工作范围为 40-60VDC,输出为 10-15VDC,并通过 PMBusTM 接口提供全面的监控、配置和控制。在54V输入和40A负载下,效率为97.3%。
对于低功耗系统,BMR320(图 2,中间)具有 8:1 的转换比,并且同样是非隔离和非稳压的。该器件的额定连续功率为 400W,对于 5-7.5VDC 的输入,其输出为 40-60VDC,它与PoL转换器的输入相匹配,该转换器在较低的输入电压下优化为最高效率。一个例子是BMR510(图2,右),它是一个2相VRM或集成功率级,每相40A,总电流80A。LGA 封装的占位面积仅为10 x 9mm,高 7.6mm,针对顶部冷却进行了优化,并集成了驱动器、功率级和磁性器件。通过合适的控制器,它可以输出可编程的0.5至1.3VDC。BMR510的输入范围为4.75-16V,因此它可以与输出电压更高的总线转换器一起使用,但效率会有所降低。
图 2:Flex 电源模块的高效总线转换器(左、中)和 PoL 功率级(右)
通过根据连续和峰值负载需求选择总线转换器比率和额定功率的选项,可以灵活地优化效率和功耗,以便于冷却。图 3 显示了使用 BMR313 4:1 总线转换器、BMR320 8:1 总线转换器和 BMR510 PoL 搭配的两种方案,这两种情况在约400W的总负载下产生约87%的相同端到端效率。尽管BMR313在远低于其连续额定功率1kW和3kW峰值的下运行,但峰值效率出现在约400W处。在PCIe之类的负载需要12V的情况中,PoL转换器中消耗更多的功率,那么4:1的解决方案可能是优选的。相比于BMR320 在 6V 输出, 48V 输入,BMR510 PoL 的运行效率更高,功耗相对较低,总线转换器中的功耗相对较高,但这离终端负载更远,可能更容易冷却。然而,对于6V总线,对于相同的终端负载功率,中间总线电流更高,与12V中间总线电压相比,在相同的功率损耗下需要更重的跟踪。
图 3:总线和 PoL 转换器的不同布置,端到端效率大致相同,但损耗分布不同
结论
对于“小巧而强大”的电源架构,可以检查Flex电源模块的总线和PoL转换器数据手册,以找到负载、电压转换组合和配电损耗的“最佳点”,其中效率达到峰值。Flex Power Designer软件[5]也支持上述所有器件,以便在所选应用中快速配置和评估性能。
参考
[1] https://www.grandviewresearch.com/industry-analysis/artificial-intelligence-ai-market.
[3] www.flexpowermodules.com
[4] The benefits of hybrid regulated ratio topologies for IBCs
[5] Flex Power Designer Software
www.flexpowermodules.com