随著企业应用从单一聊天机器人,转向由多个 AI 代理协作完成复杂任务,开发者面临通讯成本、情境漂移(context drift)与推论费用快速攀升等挑战,同时也需要更高透明度,才能信任 AI 自动化关键工作流程。NVIDIA 指出,Nemotron 3 正是针对上述痛点设计,兼顾效能、开放性与成本效率。

NVIDIA 创办人暨执行长黄仁勋 表示,开放式创新是 AI 进步的基础,透过 Nemotron,NVIDIA 正将先进 AI 技术转化为开放平台,让开发者能以更高透明度与效率,打造大规模代理型 AI 系统。

Nemotron 3 也成为 NVIDIA 主权 AI(Sovereign AI)策略的重要一环,已获欧洲、南韩等地多个组织采用,协助各国与企业依自身资料、法规与价值观建置 AI 系统。包括 ServiceNow、埃森哲、德勤、安永、Palantir、Perplexity、西门子、Oracle Cloud Infrastructure、CrowdStrike、Zoom 等,已开始将 Nemotron 系列模型整合至制造、资安、软体开发与企业服务流程。

ServiceNow 董事长暨执行长 Bill McDermott 指出,ServiceNow 的智慧工作流程自动化结合 Nemotron 3,可在效率、速度与准确度上持续拉高企业 AI 的标准。

在多代理系统架构下,NVIDIA 强调「模型路由」的重要性,让工作流程能在前沿级专有模型与 Nemotron 开放模型间动态分配任务,以兼顾推理能力与成本最佳化(token economics)。Perplexity 执行长 Aravind Srinivas 表示,透过代理路由机制,能在需要时使用 Nemotron 3 Ultra 等高阶模型,同时确保整体系统维持高效率与可扩展性。

在模型规格上,Nemotron 3 Nano 为 300 亿参数模型,单次任务仅启用最多 30 亿参数,主打低推论成本;Super 约 1,000 亿参数,适用多代理推理;Ultra 则为约 5,000 亿参数的高阶推理引擎。Nano 已开放使用,相较前一代可提升最高 4 倍词元输送量、降低最高 60% 推论生成成本,并具备 100 万词元情境窗口。独立机构 Artificial Analysis 亦评为同级模型中兼具开放性与效率的代表。

Nemotron 3 Super 与 Ultra 采用 NVIDIA Blackwell 架构的 4 位元 NVFP4 训练格式,大幅降低记忆体需求并提升训练效率,使更大型模型能在既有基础设施上完成训练,且准确度不逊于高精度格式。

除模型外,NVIDIA 同步释出 3 兆词元的 Nemotron 训练与后训练资料集,以及 NeMo Gym、NeMo RL、NeMo Evaluator 等开源工具,协助开发者客制化专业代理型 AI。Nemotron 3 Nano 已在 Hugging Face 上线,并透过多家推论服务与云平台提供,Super 与 Ultra 则预计于 2026 年上半年开放。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
外资单周卖超逾1700亿居今年次高 法人:AI撑盘年底台股仍可表现