辉达推出推理式自驾模型Alpamayo 虚拟里程解决长尾难题
黄仁勋在演讲中正式揭示具备「思考」与「推理」能力的推理式自动驾驶模型Alpamayo。他指出,该模型已被下载数百万次,并实际用于辉达自身的自动驾驶研发流程,不再只是展示性技术,而是已成为核心开发系统。
黄仁勋说明,透过情境生成与评估技术,辉达能在电脑中完成相当于数十亿、甚至数兆英里的虚拟行驶,大幅加速自动驾驶系统的训练与验证,让系统不再受限于真实世界资料搜集的速度与规模。
在技术架构上,Alpamayo采端到端训练方式,从摄影机输入一路到动作输出,训练资料结合大量人类实际驾驶示范,以及由Cosmos世界模型生成的合成里程,并搭配高度精细标注资料,让AI能真正学会如何驾驶。
与传统系统不同,Alpamayo不仅能即时控制方向盘、煞车与加速,还能对即将采取的行动进行推理,主动说明决策原因与后续行驶路径。黄仁勋形容,这让车辆在复杂情境中做到「先思考,再行动」,也是解决自动驾驶长期面临「长尾问题」的关键。
Cosmos成实体AI关键基础 让AI理解物理世界规则
在实体AI的关键基础上,黄仁勋特别点名Cosmos开放世界基础模型。他指出,实体AI的核心难题,在于如何让只存在于电脑中的智慧,理解并遵循物理世界的规则,包括物体恒存、因果关系、重力、摩擦力与惯性等人类直觉。Cosmos正是为此而生,让AI能在高度真实的模拟环境中学习、验证与修正自身行为。
在Cosmos架构下,辉达推出Cosmos Reason 2,协助AI与机器人在实体世界中进行推理与理解;Cosmos Transfer与Predict则能生成大规模、符合物理法则的合成影片,成为训练实体AI的重要资料来源。这套模拟与合成资料能力,也被视为推动实体AI迈向规模化的关键。
相关技术已被多家企业导入实际应用,包括Salesforce、Hitachi、Uber、Milestone、VAST Data与Encord,透过Cosmos Reason建构交通与职场生产力AI代理;在机器人领域,Franka Robotics、Humanoid与NEURA Robotics,则利用Isaac GR00T与Cosmos进行量产前的模拟、训练与行为验证。
八年前布局全堆叠架构 与宾士合作加速自动驾驶量产
回顾辉达在自动驾驶领域的布局,黄仁勋指出,公司早在八年前便投入相关研发,并非只著眼单一模型,而是打造完整技术堆叠。从实体载具、GPU与CPU、Omniverse与Cosmos模拟平台,到模型层Alpamayo与车厂应用层,已形成完整架构,Alpamayo也正式开源,成为辉达首个全堆叠式自动驾驶成果。
在安全设计上,他强调实体AI必须具备多样性与冗余性。Alpamayo虽采端到端训练,但同时搭配可完全追溯的传统自动驾驶系统作为防护,两套系统同步运行,并由安全评估机制决定是否交由推理模型接手,或回退至保守模式。
黄仁勋透露,搭载相关系统的Mercedes-Benz CLA已通过NCAP评测,象征辉达自动驾驶技术正从研发阶段,正式迈向量产与商用。
展望未来,黄仁勋认为,自动驾驶将是第一个大规模落地的实体AI市场,其背后的模拟、合成资料与三种电脑架构(GB300、THOR、RTX PRO),也将扩散至工业机器人、行动机器人,甚至人形机器人领域。
黄仁勋直言,下一个时代,就是机器人的时代,实体AI将不再只存在于模型与萤幕中,而是正式走进真实世界。
點擊閱讀下一則新聞