根据财联社报导,辉达之所以能独领风骚,主要关键原因之一在于其广受人工智慧领域追捧的晶片产品,即A100晶片及更新一代的H100晶片,目前这些高阶晶片及相应的显卡已是一卡难求。
微软亚洲研究员的高级研究员张弋近期在播客节目中感叹,现在居然到了整个地球都拿不出足够的A100晶片的奇景,在1年前,几乎没有人会料到这种情形。
辉达2020年推出的A100晶片现在是有价无市,而受惠于ChatGPT爆红的H100更是被各大科技业者疯狂抢购。也让辉达的业绩一路长红,股价更是节节攀升。
AI人工智慧领域的新创公司Core Weave创办人兼执行长Brannin McBee感叹:「H100是地球上最稀缺的工程资源之一。」这句话足以形容目前辉达迎来的盛景。
至于为何只有辉达的晶片成为人工智慧领域独一无二的玩家?而辉达一向在显卡称霸的公司,又为何能在深度学习和人工智慧领域打下这么大的一片江山?
财联社指出,1999年,初露头角的辉达首次推出GPU这概念。在此之前,包括英特尔在内的CPU厂商都坚信图形处理是CPU的任务,CPU做的事情愈多愈好,将图形工作独立到另一附属处理器上的想法十分鸡肋。
当时,图形应用领域中又以开发游戏的日本厂商具有话语权,日系主机的CPU很强,大部分开发工作都集中于CPU之上,因此GPU并没有获得多少市场空间。
转机在于,微软想要冲击属于日本游戏厂的领先地位,其开发出Direct X这标准化的API图形介面,之后大量的图形功能从CPU里面移植出来,转到GPU之上。加上微软另一产品Xbox的推出,其CPU、GPU各司其职的搭配,打破业界CPU晶片一家独大的局面。
辉达当年是少数几家跟著微软发展的公司,并深耕GPU领域,之后微软又推动另一次变革,引入统一渲染技术,即让GPU将图形绘制的顶点计算和之后的渲染两个步骤进行合并,它和显卡领域另一知名公司ATI合作GPU Xenos,成功应用此技术。
统一渲染只是图形应用上的一步,却给辉达带来完全不同的发展契机,可以说是辉达在后来GPU发展,甚至介入深度学习领域中的起点。
财联社指出,在看到统一渲染架构之后,辉达果断地将自己之前的GPU架构推倒重来,其GPU流处理器被进行细致的分组,变成一个个小型流处理器且能单独运作,解决流处理器之前被绑定无法独立运作而被迫闲置的问题。
这奠定辉达后来革命性CUDA架构的出世。由于辉达的流处理器是很独立且标准的单元,极易控制和调度,这让原本只能连续处理的任务可以被并行处理。让程式设计难度大大降低。
与此同时,辉达的竞争对手ATI因为早期没有投入硬体架构变革,因为沿用过去的串列设计,沉没成本越来越高,让其革新变得愈来愈难且愈来愈贵,最后成功被辉达挤出显卡市场。
此后,辉达又在2017年引入Tensor Core计算单元概念,其专门为深度学习而设计,支援更低精度的运算,从而大幅节省模型算力。
这一专用的加速单元明显排挤CUDA处理深度学习的空间,但也同时也对辉达竞争对手杀个措手不及,让AI专用晶片不再吸引人,于是,辉达GPU成为AI领域最被认可的硬体。
2003年,快速反复运算,不断试错的辉达推出一个不受欢迎的项目,其开发一款SoC晶片,将基于ARM架构的CPU与自己的GPU整合在一起。
自SoC晶片之后,辉达每隔几年都发表一些晶片。2015年,其推出Tegra K1,使用ARM公版CPU和自己的开普勒架构GPU,但由于功耗和发热皆不尽理想,对大部分使用者来说很折磨。
但业内人士却对这些挫折十分认可,一位投资人曾说,辉达在守住GPU基本盘的同时,不断向新的领域伸出触角,并让无数买它显卡的人陪它分摊成本。他还称赞,虽然辉达的很多东西,如CUDA在一段时间内看不到落地的场景,但在试错过程中,它建立起完整的生态,并在一股新风向袭来时,成功站上风口。
这也是辉达GPU打败其他晶片,成功吃下AI红利的一个原因。一方面,GPU的通用性更佳,比专用晶片更适应变化;另一方面,辉达拥有完整生态,让它的GPU成为现阶段最合适的那个选择。
事实上,当AI一瞬间爆发,业界发现,GPU是简单高效运作生成式AI模型的最好选择,一个本用来玩游戏的GPU不太可能切换去跑AI程式,目前只有辉达的GPU能够做到运作AI模型。
爆料信箱:news@nextapple.com
★加入《壹苹》Line,和我们做好友!
★下载《壹苹新闻网》APP
★Facebook 按赞追踪