登录路演时代
忘记密码
忘记密码
忘记密码
欢迎注册路演时代
已有账号?马上登陆
黄仁勋最新访谈
发布来源: 路演时代 时间: 2026-04-16 11:21:51 0


1. 利润率、定价权与总拥有成本 (TCO) 的主导地位

没有人能向我证明,当今世界上有任何一个平台的性能 TCO 比率优于我们。一家都没有。Dylan 的 InferenceMAX 就在那里供所有人使用,但没有一个能打的 ——TPU 不行,Trainium 也不行。我欢迎 Trainium 来展示他们一直声称的 40% 成本优势。这绝对毫无道理。从第一性原理来看,这根本说不通。

Nvidia 的利润率是 70%,但 ASIC 的利润率也有 65%。你到底省下了什么?你总得付钱给某人。据我所知,ASIC 的利润率高得惊人。

我们从不这样做(价高者得)。你设定好价格,然后由人们决定是否购买。我了解到芯片行业的其他公司会在需求增加时调整价格,但我们不会。我更希望成为一个可靠的、作为行业基石的存在。如果我给你报了价,那就是最终的价格。仅此而已。

如果我们的合作伙伴建造了一个 1 吉瓦 (GW) 的数据中心,那么这个数据中心最好能产出最大数量的收入和 Token。我们拥有全球每瓦特产出 Token 数量最高的架构。


2. 软件商品化 -- 看涨逻辑

我看到的其实与大众所见截然相反。我认为智能体 (agent) 的数量将呈指数级增长,工具使用者的数量也将呈指数级增长。这些工具的所有实例数量极有可能迎来飞速飙升。

今天我们受限于工程师的数量。明天,这些工程师将得到一群智能体的支持。我们将以前所未有的方式探索设计空间,并继续使用我们现有的工具,我认为工具的使用将推动软件公司实现飞跃式发展。


3. 营收集中度与客户构成

你说我们 60% 的客户集中在前五大厂商,但其中大部分业务是面向外部的。AWS 中大部分 Nvidia 业务是服务于外部客户,而非内部自用。我们在 Azure 的客户 —— 显然,我们所有的客户都是外部的。他们青睐我们的原因在于我们的触达范围如此之广。我们可以为他们带来世界上所有最优质的客户。

Anthropic 是一个特例,而不是一种趋势。如果没有 Anthropic,TPU 根本不会有任何增长。这 100% 是因为 Anthropic。如果没有 Anthropic,Trainium 根本不会有任何增长。这 100% 是因为 Anthropic。我认为这是众所周知且显而易见的。这并不意味着 ASIC 机会随处可见。世界上只有一个 Anthropic。

我并不介意别人使用其他产品或进行尝试。如果他们不尝试其他东西,怎么会知道我们的产品有多好呢?有时你必须被提醒一下。我们必须不断赢得我们现在的地位。看看有多少 ASIC 项目被取消了。仅仅因为你要制造 ASIC—— 你仍然必须制造出比 Nvidia 更好的东西。这并不容易。除非 Nvidia 真的漏掉了什么关键环节。


4. 竞争护城河与防御性

输入的是电子,输出的是 Token。中间环节是 Nvidia。将电子转化为 Token,并随着时间的推移让这些 Token 变得更有价值,这一过程很难被完全商品化。为了让 Token 产生价值所投入的艺术、工程、科学和发明 —— 包括制造过程以及其中涉及的所有科学 —— 远未被深入理解,而且这段旅程远未结束,我不认为它会被商品化。

我们是世界上唯一一家每年都在全力产出的公司。每年都有巨大的飞跃。你大可以去世界上找另一支 ASIC 团队,看看你是否敢说:“我可以押上全部身家,押上我的整个业务,赌你每年都会为我守候。你的 Token 成本每年都会下降一个数量级。我可以像信赖时钟一样信赖这一点。”

我们派驻到这些 AI 实验室的工程师数量惊人,他们与实验室合作,优化其技术栈。没有人比我们更了解自己的架构。这些架构不像 CPU 那样通用。Nvidia 的 GPU 就像 F1 赛车。每个人都能以一百英里的时速驾驶它,但要将其推向极限则需要相当深厚的专业知识。我们的专业知识通常能帮助 AI 实验室合作伙伴轻松地将其技术栈性能再提升 2 倍。当我们完成对特定内核的优化时,他们的模型速度提升 3 倍、2 倍或 50%,这并不罕见。


4. CUDA 生态系统与飞轮效应

对我们公司而言,最重要的一点就是我们生态系统的丰富性,也就是开发者生态。目前我们已经部署了数亿颗 GPU。每个云平台都有我们的产品。如果你是一家机器人公司,你会希望 CUDA 栈能直接在机器人内部运行。我们几乎无处不在。这种装机量意味着,一旦你开发出软件或模型,它在任何地方都能派上用场。

这种飞轮效应源于装机量、我们架构的可编程性、生态系统的丰富性,以及全球拥有数万家 AI 公司这一事实。如果你是其中一家 AI 初创公司,你会选择哪种架构?你会选择最普及的那一个 —— 而我们就是最普及的。你会选择装机量最大的那一个 —— 而我们就是最大的。你还会选择一个丰富的生态系统。

我们的性价比极高,因此他们的代币 (token) 成本最低。我们的能效比 (perf per watt) 也是全球最高的。如果你的目标是出租基础设施,我们拥有全球最多的客户。这就是飞轮效应发挥作用的原因。


5. 架构相较于 ASIC 和 TPU 的优势

摩尔定律每年大约进步 25%。想要真正实现 10 倍或 100 倍的飞跃,唯一的途径就是每年从根本上改变算法及其计算方式。这正是 Nvidia 的核心优势。我们之所以能让 Blackwell 的能效比 Hopper 提高 50 倍 —— 仅靠摩尔定律是根本无法实现的。

从 Hopper 到 Blackwell,就晶体管本身而言,增幅大约是 75%。这两代产品相隔三年。但 Blackwell 的性能是 Hopper 的 50 倍。我的观点是,架构至关重要。计算机科学至关重要。

如果你想提出一种新的注意力机制,以不同的方式进行解耦,或者发明一种全新的架构(比如混合 SSM),你会需要一个通用的可编程架构。Nvidia 是一家极度追求协同设计的公司。我们可以将计算卸载到交换矩阵本身(如 NVLink),或者通过 Spectrum-X 卸载到网络中。我们可以同时对处理器、系统、交换矩阵、库和算法进行变革。如果没有 CUDA 来实现这一切,我甚至不知道该从何下手。

我们在模拟器中对这一切进行了模拟 —— 事实证明效果更差。我们正在开展的正是我们想要做的项目。如果我有更多的资金,我会加大对 Nvidia 架构的投入。


6. 产品路线图与发布节奏

关于 Nvidia,你可以确信的一点是,今年 Vera Rubin 将会表现惊人。明年,Vera Rubin Ultra 将会面世。后年,Feynman 将会到来。再往后的一年,我还没有公布那个名字。每一年的表现你都可以信赖我们。

如果你想购买价值 10 亿美元的 AI 工厂算力,没问题。1 亿美元,没问题。1000 万美元,或者仅仅一个机架,也没问题。如果你想订购价值 1000 亿美元的 AI 工厂,同样没问题。我们是当今世界上唯一一家能让你说出这种话的公司。


7. 供应链策略与上游承诺

我们在上游做出了巨大的承诺。其中一些是显性的,一些是隐性的。上游的许多投资是由我们的供应链完成的,因为我对那些首席执行官们说:“让我告诉你们这个行业将会有多大规模。” 通过向上游各行各业的首席执行官们传递信息、激发灵感并达成共识,他们才愿意投入资金。

为什么他们愿意为我投资,而不是为别人?因为他们知道我有能力购买他们的供应,并通过我的下游渠道将其售出。Nvidia 的下游需求如此巨大,以至于他们愿意在上游进行投资。

如果我们未来几年的规模达到万亿美元,我们拥有足以支撑这一目标的供应链。如果业务周转率低,没有人会为一个架构去构建供应链。我们之所以能够维持这种规模,仅仅是因为我们的下游需求如此巨大。

我们现在提前数年预判并解决瓶颈问题。过去几年我们对 Lumentum、Coherent 以及硅光子生态系统的投资,确实重塑了供应链。我们围绕 TSMC 建立了一套完整的供应链。我们与他们在 COUPE 项目上合作,发明了相关技术,并将这些专利授权给供应链,以保持其良好的开放性。


8. 瓶颈与产能扩展

这些瓶颈没有一个会持续超过几年 —— 两三年,一个都不会。与此同时,我们正在将计算效率提高 10 倍、20 倍,而在从 Hopper 到 Blackwell 的跨越中,效率提升了 30 到 50 倍。

一旦你能造出一个,你就能造出十个;一旦你能造出十个,你就能造出一百万个。这些东西并不难复制,你只需要一个需求信号。

注意到人们现在不再怎么谈论 CoWoS 了。原因在于,这两年来我们全力以赴地解决了这个问题。我们翻倍、翻倍、再翻倍,连续翻了好几倍。TSMC 现在明白,CoWoS 的供应必须跟上逻辑芯片和内存的其他需求。

令我担心的事处于我们的下游。阻碍能源获取的能源政策 —— 没有能源就无法创造一个产业。更多的芯片产能 —— 这是一个 2 到 3 年的问题。更多的 CoWoS 产能 —— 也是一个 2 到 3 年的问题。


9. 推理市场细分与 Groq

Token 的价值已经变得如此之高,以至于你可以对 Token 进行差异化定价。你可以拥有不同的客户,而这些客户需要不同的答案。如果我能为软件工程师提供响应速度更快的 Token,从而让他们更具生产力,我愿意为此付费。这个市场直到最近才刚刚兴起。

我们决定扩展帕累托前沿,并创建一个响应时间更快、即便吞吐量较低的推理细分市场。直到现在,更高的吞吐量始终被认为更好。我们认为未来可能会出现高 ASP(平均售价)代币的世界,尽管工厂的吞吐量较低,但 ASP 足以弥补这一点。这就是我们收购 Groq 的原因。


10. 资本配置与对 AI 实验室的投资

我当时并没有深刻意识到建立一个人工智能基础实验室会有多么困难,以及他们实际上需要供应商自身投入巨额资金。我们当时的情况并不足以向 Anthropic 注入数十亿美元的投资来让他们使用我们的算力。但 Google 和 AWS 做到了。那是我的失误。但我不会再犯同样的错误了。

我一直以为他们可以像所有公司那样,直接从风险投资人那里融资。但我现在意识到,他们当时想做的事情是无法通过风投实现的。我当时并不知道这一点。

我们不挑选赢家。我们需要支持每一个人。当我投资其中一个时,我就是在投资他们所有人。Nvidia 刚起步时,有 60 家 3D 图形公司。我们是唯一存活下来的。Nvidia 本该在那份 “无法成功” 的名单中名列前茅。所以我保持足够的谦逊来认识到这一点。

当像 OpenAI 这样的公司在 IPO 之前需要 300 亿美元规模的投资,而我们又深信他们的潜力时 —— 我们会进行这类投资,因为他们需要我们这么做。但我们并不是想尽可能多投,我们是在尝试尽可能少投。


11. 云策略与 Neocloud 生态系统

如果我没有以我们现在的方式构建 NVLink,如果我们没有构建整个技术栈,如果我们没有在大部分时间都在亏损的情况下致力于 CUDA 20 年 —— 那么没有其他人会这样做。然而,世界上有很多云服务商。如果我不做,总会有人出现。所以,我们要遵循的哲学是:做尽可能多必要的事,但做尽可能少非必要的事。

如果我们不支持 CoreWeave 的存在,这些新云 (neoclouds)、这些 AI 云就不会存在。我们投资于我们的生态系统,是因为我希望我们的生态系统能够蓬勃发展。我希望 AI 能够与尽可能多的行业和国家建立联系,并让这个星球能够构建在 AI 和美国技术栈之上。

我们想涉足融资业务吗?答案是否定的。已经有人在做融资业务了,我们宁愿与所有从事融资业务的人合作,也不愿自己成为融资者。我们的目标是专注于我们所做的事情,保持我们的商业模式尽可能简单,并支持我们的生态系统。


12. 中国与出口管制

放弃美国科技行业的市场是对我们国家的一种损害。这损害了我们的国家安全,损害了我们的技术领导地位 —— 而这一切仅仅是为了某一家公司的利益。全球 50% 的 AI 开发者都在中国。美国不应该放弃这一点。

你所倡导的政策导致美国电信行业基本上被排挤出了全球市场,以至于我们甚至无法再掌控自己的电信产业。这种做法有些目光短浅,并导致了意想不到的后果。

我们在这里应该始终拥有最好的技术。我们在这里应该始终拥有最先进的技术,并且保持领先。但我们也应该努力在全球范围内竞争并取胜,这两件事可以同时实现,这需要一定程度的细致权衡和成熟度,而非走极端。

建立两个生态系统将是极其愚蠢的:一个是仅在外国技术栈上运行的开源生态系统,另一个是在美国技术栈上运行的封闭生态系统。我认为这对美国来说将是一个可怕的结果。

中国是全球开源软件的最大贡献者。事实。中国是全球开源模型的最大贡献者。事实。如今,这一切都建立在美国的技术栈 ——Nvidia 的技术栈之上。事实。人工智能技术栈的所有五个层级都至关重要。美国应当力争在所有这五个层级上都取得胜利。


温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)。