郭明𫓹也说明Nvidia取消NVL36*2选择NVL72的5大原因:

第一,开发资源有限。原本三个项目(NVL36、NVL72、NVL36*2)同时进行,但资源集中至 NVL72 和 NVL36*2 的开发。由于 NVL36 预计进入量产阶段,因此在有限的资源下开发两个 72 GPU 版本变得更加困难。

第二,节省资料中心空间。NVL72 具备优化的散热设计,可以比 NVL36*2 节省一个机柜的空间,从而提高资料中心的空间使用效率。

第三,推理效率更佳。NVL72 在 AI 推理,特别是自回归模型等不易平行化设计中,表现优于 NVL36*2。

第四,主要客户偏好。例如微软等大型客户更偏好单柜版 NVL72。

第五,兑现承诺。Nvidia 一直在公开场合强调 NVL72,开发此版本是兑现公开承诺的关键。

郭明𫓹认为,NVL72 开发面临史无前例的技术挑战,尤其是在 132kW 的 TDP(Thermal Design Point)设计要求下,成为历来功耗最高的伺服器。若 EDP(Electrical Design Point)超过设计范围,可能需要额外的 Sidecar,进而增加设计与量产难度。此外,Sidecar 设计需稳定控制 Approaching temp 在 5–10°C 内,若标准放宽可能会影响系统的稳定性。

郭明𫓹根据供应链调查,认为NVL72 的量产时程可能延至 2025 年下半年 (相较 Nvidia 乐观预期为 2025 年上半年),这一延迟将给供应链带来更大的压力,也可能影响市场对 Nvidia 执行力的信心。

面对辉达激进的产品换代策略,瑞银投资银行台湾硬体科技研究部主管陈星嘉(Grace Chen)先前表示,台湾厂商虽然乐观其成,但产品从设计代工到出货的时间大幅缩短,从3月的GTC大会宣布GB200到预计在今年第四季出货,准备时间缩短,这使得具备更强资金及整合优势的一线厂商在GB200这代中更加明显。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
国泰金COP29气候领袖论坛 总座李长庚:解锁系统性变革有两关键