登录路演时代
忘记密码
忘记密码
忘记密码
欢迎注册路演时代
已有账号?马上登陆
OpenAI和xAI自研ASIC或推迟半年,与AWS千亿合约带来Trainium增量
发布来源: 路演时代 时间: 2026-03-06 17:31:17 0

英伟达是否会在 GTC 大会上推出 LPX 机架?其目标应用场景、客户群体?芯片架构?

根据目前信息,英伟达在 GTC 大会上预计会发布四款硬件产品,其中大概率会有一款基于 LPX 的解决方案。LPX 解决方案可能存在多种形态,一种是基于原有 Blackwell 产品升级的高密度机架式解决方案;另一种可能性是芯片级的集成解决方案。其核心目标是为了保障并提升在推理市场的竞争力。随着训练市场规模趋于饱和,客户需求更多地转向推理侧,英伟达希望通过 LPX 在推理市场保持其在训练市场那样的控制力,以确保业务的持续增长和市场占有率。关于 LPX 的具体产品架构,目前尚未最终确定,可能是高密度机架与其他产品的组合,也可能是单芯片方案或模组内的混合架构方案。行业内普遍判断,本次 GTC 大会上英伟达只会阐述其对推理市场的基本看法和未来市场策略,而不会公布 LPX 产品的最终形态和决策。因此,目前还无法对产品的最终形态做出判断。

LPX 样机和出货时间点预期?

目前来看,在 GTC 大会上应该还看不到 LPX 的样机和明确的出货时间点。根据与行业内客户的沟通,英伟达尚未就这款机型给出任何具体的时间节点。据悉英伟达计划在 2026 年年底推出相关产品,但这批产品预计不会提供给用户送样测试,而是用于内部评测和软件适配。面向客户的样品交付预计要到 2027 年第一或第二季度才有可能。考虑到距离 2027 年上半年还有较长时间,产品在此期间会不断进行更新和调整,因此短期内英伟达不会向客户提供关于产品最终形态的更详细预期。

LPX 所使用的 LPU 为下一代 4 纳米产品?代工情况?

是的。这款芯片的设计已经完成并投片,预计将在 2026 年晚些时候交付给英伟达用于整体系统策划,因此不会有大幅调整。工艺方面,可能会将原有的方案从三星转移至台积电,也可能继续使用三星。由于芯片工艺提升,功耗和散热问题得到更好的保障,可以实现更灵活的解决方案,因此预计将在机架密度上做出较大幅度的提升。

如何看待英伟达近期对 Lumentum 和 Coherent 的投资?这是否会加速其在 Scale-up 中对 CPO 的应用?

英伟达的策略是分步走的,认为直接转向 CPO 存在一定风险,因此目前仍采用 NPO 方案。对 Lumentum 和 Coherent 的投资,可以确保英伟达在连接器层面能够获得这两家厂商的最新产品,并进行早期的配合与合作。这无论对于其交换机端还是 GPU 端未来的解决方案,都能提供较大帮助。此举可以看作是英伟达对 CPO 领域的早期布局,既不影响当前产品的更新迭代,又能提前锁定核心供应商和资源,为其未来转向 CPO 提供支持。这种做法与之前在 HBM 领域锁定整个产业链的策略相似,表明英伟达对 CPO 方向非常看重。

在 Meta 与 AMD 达成 1,000 亿美元协议后,今明两年 MI 系列向 Meta 的交付预期是否有明显提升?

该协议并未对 MI455 的交付节奏带来太大影响。Meta 当前优先想获取的是 MI450,以解决其迫在眉睫的 GPU 短缺问题,并且主要将 AMD 产品定位于推理应用。Meta 认为 AMD 的产品目前还无法在训练场景中扮演更重要的角色。因此,MI455 是其后期的关注点,而非前期的主要目标。Meta 当前的核心是解决眼下的推理需求,而 MI455 这类能够对标 GB200/GB300 的高密度机架解决方案,涉及到产品一致性、集群使用率和软件生态等更复杂的问题,是 Meta 下一步才会关注的重点。目前了解到的情况是,Meta 与 AMD 在这一层面尚未进行深度配合。目前 MI450 的交付数量没有新的变化。Meta 与 AMD 签署的是一个上限为 20 万片的协议,确保为 Meta 预留这部分产能,但要求分期交付,并未要求一次性完成。该协议总时长为 4 年,计划在 2028 年完成,目前还剩下约 3 年的执行期。

Meta 是否取消了其自研芯片 MTIA 第三个版本 Olympus 的研发?未来在训练和推理端是否会更依赖 AMD 或英伟达?

Meta 并未完全取消 Olympus 的研发,而是对其优先级进行了调整。当前,Meta 将关注重点放在自研推理芯片的应用上,而将训练芯片的研发计划向后推迟。这一变化的原因有两方面:首先,Meta 目前拥有大量的训练资源(包括自建和租赁),足以保障其训练需求,同时认为自研训练芯片要实现对英伟达产品的完全替代难度较大;其次,Meta 内部硬件团队的稳定性不佳,人员流失严重,管理问题导致其认为即使推出自研训练芯片,效果也可能无法与英伟达形成替代关系。因此,Meta 选择将资源倾向于与 AMD、谷歌等厂商合作,以快速满足现有需求,同时围绕其更有把握的自研推理芯片继续推进。

OpenAI 与 AWS 近期额外拓展了 1,000 亿美元的合作,其中对 GB/VR 系列、Trainium 3 和 Trainium 4 的需求增量是如何分配的?

这次合作的大部分增量需求将分配给 Trainium 3 和 Trainium 4,而给英伟达的增量并没有太大变化。OpenAI 发现 Trainium 3 和 Trainium 4 经过快速适配后,在其使用场景中效果不错。由于 OpenAI 掌握其模型的底层逻辑,了解模型对硬件的具体需求,因此认为 Trainium 3 和 Trainium 4 的架构在加速逻辑上与其当前需求更为契合。此次增资并未对 AWS 与英伟达原有的协议带来显著变化,原合同体量基本维持不变。同时,OpenAI 也未向 AWS 明确提出要求将这笔投资用于采购更多的英伟达产品。

这笔新增投资大概对应今年多少张 Trainium 芯片的增量?

这笔投资是分阶段实施的,并非最终的确定数字。根据 AWS 方面的信息,由于 OpenAI 的增资和新需求,他们计划提前 Trainium 3 和 Trainium 4 的整体节奏。在 Trainium 3 这款产品上,计划将规模扩展约 20 万至 25 万张卡,上限甚至可能达到 40 万张卡。这是一个近期的数字,后期是否会随着资金的分阶段投入而有更大规模的叠加,目前尚不确定。

OpenAI 和微软方面对于 2026 年 MI355 和 MI450 的需求是否有更新?

目前没有更新。微软要求 OpenAI 提供明确的需求才会进行相应部署,但 OpenAI 方面并未提出明确要求。这主要是因为 OpenAI 现在除了微软,还有其他几家合作方也陆续引入了 MI450,使其拥有了多家供应商的选择方案,因此不愿意向微软单方面做出承诺。鉴于双方协议的严格执行性,OpenAI 不愿给出明确需求,微软也因此不愿投入,导致新增协议的推进陷入僵持。目前,微软仅在落实此前已达成的协议,对于 OpenAI 提出的新想法,微软坚持要求对方提供明确订单后才会推进。

近期 OpenAI 的投资预期调整是否影响了其自研 AI 芯片的进度?

OpenAI 自研芯片的进度已经延后。公司近期获得的资金主要用于支付前期数据中心的交付款项,没有额外的资金空间投入到芯片研发中。当前,OpenAI 的优先事项是完成大量数据中心的交付并确保其充分利用,自研芯片的优先级已相应降低。从博通方面也了解到,OpenAI 目前并未催促进度,芯片交付的排期也并不紧迫。

两个月前 OpenAI 宣布 “Code Red” 后,其团队及策略上是否看到显著变化?

“Code Red” 最初意在表明公司有紧急的策略转向。之后,公司确实进行了一些策略调整,包括大规模招聘高水平人才和调整团队架构。然而,目前来看,其策略仍不明晰,并且当时大力招聘的人才中,已有相当一部分再次流失,人员流动性很大。从模型推出的节奏来看,“Code Red” 的主要原因是其模型在多方面开始落后,且整体战略不清晰导致资源过度分散。公司现在也过多地强调未来的盈利和市场化能力。这些变动最终能带来何种效果尚不明确,市场上对此也存在相当大的疑虑。总体来看,“Code Red” 并未从根本上解决其在人员、战略、市场和资金方面面临的问题,效果不明显。

xAI 自研 AI 芯片的进展如何,是否已经投片?

xAI 的自研芯片至今尚未投片。其进度原先比 OpenAI 稍晚,但现在时间点已基本与 OpenAI 拉齐。预计可能在 2026 年第二季度到第三季度投片,但具体代工厂尚未最终决定,目前在与台积电和三星同时洽谈。考虑到该项目近期的一些动荡,包括原芯片设计团队与 SpaceX 的合并以及新架构的调整,最终投片时点可能在 2026 年下半年,回片时间大约在 2026 年底,预计 2027 年有可能实现量产。

微软的 Maia 200 芯片是否会完全在 IFS 的 18A 工艺上生产,并于下一季度实现量产?

这款产品并未在英特尔的 18A 工艺上进行生产。根据 18A 团队的反馈,其生产线上至今未见到微软的任何产品。主要原因在于,该芯片最初的制造工艺完全围绕台积电的三纳米工艺展开,包括近期回片的样品。若要转换至 18A 工艺,将面临巨大的后端设计调整,而微软目前不具备这方面的能力,且不计划为此额外支付费用。微软的意向是未来由英特尔承担这部分工作,但英特尔目前缺乏相关人力,且其 18A 工艺的后端设计库尚未成熟。因此,目前的情况是微软将决策权交给了英特尔,待其具备承接能力后再议。在此期间,Maia 芯片仍在台积电生产,现有产能足以满足其尚未大规模上量的需求。英特尔何时承接该项目,取决于其 18A 工艺的成熟度以及能否在成本上与台积电对标,否则微软不会为此买单。

有说法联发科向 IFS 下达了 TPU v8e 的 EMIB 订单,其订单量和收入贡献时点如何?

联发科确实下达了该订单,但预计要到 2026 年下半年才能执行。原因是英特尔已将 EMIB 产能转移至第三方,需等待第三方完全掌握整个流程后才能量产。联发科给出的初步数字约为 60 万颗,但这并非确定数字,最终能否达成取决于 EMIB 的最终成本和产能。这 60 万颗更像是一个预估的缺口,能否被满足还要看台积电的封装厂后期扩产能否承接新订单,以及英特尔委托的第三方能否按时满足客户要求并控制成本。目前存在较大变数,预计至少需要再过一个季度才能看到更详实的数据。

有说法腾讯向寒武纪下达了 3-6 万张 690 芯片订单,属实?

这并非一个有明确交付时间点的正式订单,只是提出了一个需求,但并未给出具体的交付节点。目前已知的是,腾讯近期会有一个基于 590 芯片的小批量采购,但后续的放量节奏尚未确定。腾讯在算力卡方面并不紧张,其今年(2026 年)还有几万张昆仑芯等厂家的卡的交付计划。因此,需要关注最终的实际交付能力,因为腾讯给出的采购预测往往不代表最终的实际采购量,其过往常有给出较大预测以确保供应商产能,但最终仅小批量交付甚至拖延一年不交付的情况。

DeepSeek V4 模型在适配上是否优先选择昇腾和寒武纪,并刻意避开英伟达?其迟迟未能上线的原因是什么?

DeepSeek V4 在推理适配方面确实优先与昇腾和寒武纪合作。这主要是因为 DeepSeek V4 要求原生支持 FP8,而目前能够原生支持该数据格式的只有寒武纪和昇腾。其他厂商的 FP8 支持并非原生,而是通过 FP16 兼容实现,或者在产能上无法满足 DeepSeek 未来大规模部署的算力需求。因此,这两家成为首选合作方,而壁仞、昆仑芯、摩尔线程等属于第二梯队的适配厂商。目前,各家厂商的适配工作已基本完成,但优化工作需等待 V4 最终版本发布后才能进行。V4 发布时间滞后的主要原因在于其集成了多项重大的技术改动。每一项改动都对模型的性能、成本及客户使用体验产生显著影响,导致团队需要进行反复的技术验证和评测,从而明显推迟了发布进程,但近期有望发布。


温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)