据《The Information》报导,辉达在资料中心领域积极抢攻,不仅与全球伺服器大厂美超微(Super Micro)合作推出能支援最新架构Blackwell的伺服器、散热解决方案,同时在多次演讲强调,如今不会单独考虑个别的GPU,而是把整个NVL72伺服器机柜视为整体,一定程度也争取到更多客户采用辉达的规格,不仅增加营收,也让自身的生态系扩大。

报导说明,过去客户只要采购适合的伺服器机柜就能打造资料中心,如今,辉达敦促这些客户直接向他们购买各式机柜,甚至整个AI资料中心基础架构「DGX SuperPOD」都由辉达来提供,辉达声称,这能将GPU效能最佳化,考虑到连结到各个GPU、伺服器以及机柜,甚至是DGX SuperPOD的介面,虽然一定程度也有其道理,但是也大大增加这些客户的采购预算。

辉达执行长黄仁勋在本月5日接受全球媒体问答之际就提出,NVLink如今已经发展到第5代,并拿起展示品,说明NVLink如何以令人难以置信的速度连接,以众多软体与处理功能,连接起数量众多的GPU,使其成为一个强大的运算单位。

辉达除了强大度CUDA运算软体平台之外,根据辉达说明,NVLink是一种汇流排及其通讯协议,1.8TB/s的双向、直接的GPU到GPU互连,可在伺服器内扩充套件多GPU输入和输出(IO)。辉达也在过去几年,陆续推出一系列专属高速I/O技术,包括GPUDirect、NVLink、NVSwitch等技术。

以GB200 NVL72 来说,连接 36 个 Grace CPU 和 72 个 Blackwell GPU,GB200 NVL72 还搭载液冷的机架级解决方案,拥有 72 个使用 NVLink 互联的 GPU,能够作为单一大型的 GPU 使用。这也使得客户若只采购GPU,没有采购整套系统,就会如辉达所述无法将效能最佳化。

不过,这也让辉达副总裁Andrew Bell在说服大客户微软能采购专为B200 GPU设计的伺服器机柜,因为微软的机柜规格与辉达所提供的产品有些硬体差异,但是微软拒绝这项提议,因为这会让微软无法轻松交互使用的其他家的产品,例如AMD的AI伺服器处理器MI300X GPU。辉达所提供的MGX模组化系统,同时支援OCP开放式伺服器机柜、美国电子工业联盟(EIA)制定的标准19吋机柜,微软则是采用更先进的、密度更高的OCP机柜,而且微软现有的资料中心仍然运作良好,若是按照辉达提议,势必得大幅提高建置成本。

最终,辉达妥协,允许微软使用自家客制化的伺服器机柜来安装B200 GPU,但这可能不会是这两家巨头的最后一次争执。早在先前,AMD、Google、微软、英特尔、博通、思科等美国大型科技公司,推出Ultra Accelerator Link(UALink)联盟,制定资料中心AI加速器晶片连接的行业标准,与辉达的NVLink对抗,然而,辉达在AI晶片市占率高达9成,能否扭转局势还得观察。

对此,黄仁勋也回应,在多年以后,市场才认识到NVLink功能对于资料中心运作相当重要,NVL72面对即时大型语言模型推论速度提高30倍,训练提高4倍,并采用液冷散热设计,让成本与能耗降低25倍。至于UALink,黄仁勋认为,还需要很多年时间才能具备完全的能力,到时候NVLink都到7或8了。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
台泥所属和平工业港 获国家环教奖企业组最高荣誉