北京时间3月19日凌晨4点,黄仁勋身着标志性的黑色皮衣匆匆登台,拉开了本次英伟达GTC 2024大会序幕。
对黄仁勋来说,「超预期」是必须要在本次GTC实现的一项任务。过去一年时间里,英伟达因为卖水人的身份赚得盆满钵满,但接近垄断的市场地位和颇具攻击性的业务布局,也让一些同行或客户感到危险,纷纷开启了自研芯片、扶持AMD等竞争对手,以及打破CUDA生态等一系列计划。
显然,如果英伟达想要继续坐稳AI时代的铁王座,黄仁勋就需要用拿出具有统治力的新产品和新业务来证明这些挑战的不堪一击。
而对投资人而言,他们更关注的是本届GTC能否继续向AI概念里注入新的想象力。虽然今天已经很少有人将AI视作泡沫,在科技巨头的财报中AI也逐渐兑现业绩,但它们已经涨上天的估值依旧让人担心,知名华尔街分析师木头姐甚至将英伟达比作思科,预言它很快将股价腰斩并一蹶不振。
担忧会成真吗?从结果来看,忧喜参半。
喜的一面在于,黄仁勋描绘的AI蓝图仍有吸引力,从硬件向AI软件乃至世界模拟器攀登,英伟达的野心大得让人咂舌。
但市场似乎并不愿意咬下这口大饼,盘后股价持续下跌,截止发稿,跌幅已达1.77%。
在本次GTC上,黄仁勋新推出的所有硬件产品,都围绕Blackwell构架展开,包括独立的Blackwell GPU、GB200 Superchip、DGX SuperPOD。
Blackwell的名称来源于美国首位黑人院士David Harold Blackwell,他创立的「Rao-Blackwell」定理是现代统计学的基础性概念。
这款芯片也如它背后的象征那样,承担着在算力需求越来越旺盛的AI时代,成为解释、研究世界的基础硬件的任务。
GB200是Blackwell系列的第一款芯片,它拥有2080亿个晶体管,采用定制的两掩模版极限4NP TSMC工艺制造,可提高大量处理能力,每秒能进行20Pflops浮点运算。
与前一代芯片H100相比,「大」是Blackwell系列芯片最直观的特点。
将GB200与H100放在一起对比,能明显看到前者大了一圈。多出来的体积让Blackwell系列芯片得以容纳更多的晶体管,并带来了更高的运算速度。
具体来说,GB200的2080亿晶体管数量是H100的2.5倍,浮点运算速度提升5倍,如果专门针对LLM推理,性能提升幅度将来到30倍。
“Hopper很好,但我们需要更大的GPU”,为了防止手中的H100感到自卑,黄仁勋专门停下演讲安慰了它一会儿。
除了「大」之外,黄仁勋还列出了另外几个使它脱颖而出的因素。
首先是第五代NVLink,它能为每个GPU提供1.8TB/s的双向吞吐量,确保今天最复杂的LLM在576个GPU之间实现无缝高速通信。
其次,Blackwell采用第二代Transformer Engine(变压器引擎)。Transformer Engine配备了新的微张量缩放支持和先进的动态范围管理算法,通过创新的4位浮AI推理功能使计算和模型大小加倍。
最后英伟达还引入了一些AI安全功能,包括包括机密计算功能和RAS(可靠性、可用性和可服务性)引擎,以确保其数据中心GPU的正常运行时间最大化。
与此同时,虽然本次大会演讲中黄仁勋没有直说,但GB200 NVL72与用于推理用途的相同数量的H100 Tensor Core相比能耗减少25倍的数据,仍让那句标志性的“买得越多,省得越多”呼之欲出。
和之前的Hopper GPU一样,Blackwell GPU将作为独立GPU提供,或者将两个Blackwell GPU组合,并与英伟达的Grace CPU配对,搭建GB200 Superchip。
除了Blackwell和Grace Blackwell芯片,英伟达还推出了采用了液冷的DGX SuperPOD超级计算机系统。
DGX SuperPOD由8个或更多GB200组成,其中包括36个GB200 Superchips,可以按需配置作为单台计算机运行。英伟达表示,如果客户需要拓展SuperPOD,最高可以支持数万个GB200 Superchips。
硬件不是这届GTC大会的全部,正如英伟达深度学习研究副总裁Bryan Catanzaro此前所表达的,虽然英伟达被称为硬件公司,但软件形成的护城河同样不容小觑。
“很多人不知道这一点,但英伟达的软件工程师比硬件工程师还多。”他说。
这次GTC大会的后一个小时,黄仁勋几乎把所有时间都花在了介绍Omniverse和NIM上。
简单来说,前者是一个旨在开发、部署和管理3D应用程序的云平台,该平台能够构建数字孪生。
而后者,是英伟达为了让企业更方便地入驻Omniverse而推出的新服务——生成式AI微服务(NIM)。
通过这些微服务,企业可以在自己的平台上创建和部署自定义应用程序,同时保留对其知识产权的完全所有权和控制权。
Omniverse和微服务(MIN)一同组成了英伟达打开机器人领域的钥匙。黄仁勋在视频中演示了一个人类与机器人协同合作的虚拟仓库。虽然视频中的工人看起来有些僵硬,但这幅关于未来工业如何运作的画面,仍帮他拿到了西门子的订单。
如前文所说,无论是对英伟达自身,还是整个AI行业,本次GTC大会都扮演着关键角色。因此有3个问题至关重要:
首先是Blackwell系列芯片及软件生态,能不能挽回那些起了异心的买家?
这个问题的答案是不确定的。
一方面,与市面上现有的GPU产品对比,GB200展现出了足够优越的性能。尤其是大模型训练热潮告一段落,AI企业相继进入商业落地阶段后,眼下推理所占算力需求比重逐渐上升,云厂商必定会大量采购GB200。
目前,微软和亚马逊都已经宣布将与英伟达展开进一步的合作。
微软CEO纳德拉在一份声明中表示:“通过将GB200 Grace Blackwell处理器引入我们全球的数据中心,我们正在为我们的云优化英伟达GPU的悠久历史奠定基础,同时我们也为世界各地的组织兑现了AI的承诺。”
亚马逊AWS同样宣布计划为寻求高级生成式AI功能的客户提供GB200 Grace Blackwell Superchip和B100 Tensor Core GPU。
但另一方面,受限于芯片链条长,扩产周期慢,Blackwell系列芯片很有可能会和当初H100一样受限于产能困境,同时新版本芯片和旧版本芯片形成替代,中国市场的疲软,此消彼长下,英伟达能否持续保持高增长,无疑需要打上一个问号。
与此同时,即便芯片性能没有英伟达优越,科技巨头们自研芯片可能也是更划算的方案。
此前,《财新》在一篇报道中透露,哪怕花英伟达同样的成本,只要做出十分之一的效果,这些科技厂商便已经有利可图。更具体的案例是,按照谷歌的报价,使用其最新的AI芯片TPUv5e在训练、推理参数少于2000亿的大模型时,成本低于用A100或H100。
整体来说,按照英伟达此前以数据中心为主的业务结构,GB200固然能带来性能优势,但短期来看对业绩增幅可能有限。
那么,本次GTC大会中究竟有没有涌现出能继续支撑英伟达业绩高增的新场景?
从黄仁勋的演讲来看,英伟达最理想的发展路径,是从硬件公司升级成AI全链条服务公司。而生物领域则是他在这个方向上竖起的路标。
黄仁勋曾在多个场合表示生物领域将是未来的主导学科,本次演讲中也花了大量时间来介绍英伟达软件生态在这一领域的成就。
目前市面上涌现出了大量尝试将AI与生物研究、制药相结合的项目和企业,但大多停留在概念层面。
此前曾有美国普渡大学AI领域PHD向「硅基研究室」透露,Domain Adaptation(领域迁移)是目前摆在医疗AI面前最主要的难关之一。他举例,以X光为代表精密仪器在不同医院、不同操作者手中形成的数据存在显著差异,很难形成标准化,甚至同一个Program对于不同种族的诊断准确率差距也很大。
而英伟达目前的布局主要集中在有机物研究,分子建模领域,从理论到商业落地之间的距离更是遥遥无期。或许从价值投资的角度来看,这是一个确定性十足的领域,但置身眼下的AI热潮,仍不够「诱人」。
相比之下,人形机器人可能是更近的业绩增量。黄仁勋像钢铁侠一样站在一排人形机器人中央时,也确实在大会现场掀起了短暂的高潮。
但可惜的是,与日前火遍全网的OpenAI、Figure合作推出的Figure 01相比,来到GTC现场的机器人并没有展现出让人眼前一亮的能力,不由让人怀疑这些机器人的智能化程度。
即便从量产的角度出发,与背靠汽车流水线的特斯拉相比,英伟达似乎也很难通过迭代芯片将人形机器人的价格推至市场化的门槛。
看上去,AI时代的卖水人似乎和大多数AI企业一样面临着如何将AI商业化落地的困窘。不过这也很好理解,当市场从AI概念的狂热中恢复冷静,所有此前受益的玩家都要经受泡沫破裂的风险。
有了前两个问题做铺垫,第三个问题的答案已经呼之欲出。
英伟达在GTC上的新动作能不能给市场描绘出更有吸引力的AI故事?显然大多数人并没有因此更加兴奋。
GTC大会召开前,英伟达、谷歌、微软、Meta股价分别上涨0.7%、4.44%、0.22%、2.66%,但大会召开后,盘后价格均出现了不同程度的下跌,其中英伟达下跌1.77%。
显然,即便在大洋彼岸,人们也不再被AI的问答、做图、做视频等功能所满足,黄仁勋和其它科技巨头一再宣传的「世界模型」,只有实实在在出现在现实世界,并且产生一些有意义的影响,才会有人继续为此买单。
但对身处AI行业的从业者来说,本届GTC大会或许也给予它们一个启示:加快步伐研究更先进的大模型,还是花更多时间来思考如何让自己的产品落地。
两种选择都充满风险,前者有可能因为越来越难融资而失败,后者则意味着有可能被迭代后更先进的大模型顺手碾压。
毕竟,这样的事情不止发生过一次,也不会是最后一次。