路演时代

OpenAI和xAI自研ASIC或推迟半年，与AWS千亿合约带来Trainium增量

英伟达是否会在 GTC 大会上推出 LPX 机架？其目标应用场景、客户群体？芯片架构？

根据目前信息，英伟达在 GTC 大会上预计会发布四款硬件产品，其中大概率会有一款基于 LPX 的解决方案。LPX 解决方案可能存在多种形态，一种是基于原有 Blackwell 产品升级的高密度机架式解决方案；另一种可能性是芯片级的集成解决方案。其核心目标是为了保障并提升在推理市场的竞争力。随着训练市场规模趋于饱和，客户需求更多地转向推理侧，英伟达希望通过 LPX 在推理市场保持其在训练市场那样的控制力，以确保业务的持续增长和市场占有率。关于 LPX 的具体产品架构，目前尚未最终确定，可能是高密度机架与其他产品的组合，也可能是单芯片方案或模组内的混合架构方案。行业内普遍判断，本次 GTC 大会上英伟达只会阐述其对推理市场的基本看法和未来市场策略，而不会公布 LPX 产品的最终形态和决策。因此，目前还无法对产品的最终形态做出判断。

LPX 样机和出货时间点预期？

目前来看，在 GTC 大会上应该还看不到 LPX 的样机和明确的出货时间点。根据与行业内客户的沟通，英伟达尚未就这款机型给出任何具体的时间节点。据悉英伟达计划在 2026 年年底推出相关产品，但这批产品预计不会提供给用户送样测试，而是用于内部评测和软件适配。面向客户的样品交付预计要到 2027 年第一或第二季度才有可能。考虑到距离 2027 年上半年还有较长时间，产品在此期间会不断进行更新和调整，因此短期内英伟达不会向客户提供关于产品最终形态的更详细预期。

LPX 所使用的 LPU 为下一代 4 纳米产品？代工情况？

是的。这款芯片的设计已经完成并投片，预计将在 2026 年晚些时候交付给英伟达用于整体系统策划，因此不会有大幅调整。工艺方面，可能会将原有的方案从三星转移至台积电，也可能继续使用三星。由于芯片工艺提升，功耗和散热问题得到更好的保障，可以实现更灵活的解决方案，因此预计将在机架密度上做出较大幅度的提升。

如何看待英伟达近期对 Lumentum 和 Coherent 的投资？这是否会加速其在 Scale-up 中对 CPO 的应用？

英伟达的策略是分步走的，认为直接转向 CPO 存在一定风险，因此目前仍采用 NPO 方案。对 Lumentum 和 Coherent 的投资，可以确保英伟达在连接器层面能够获得这两家厂商的最新产品，并进行早期的配合与合作。这无论对于其交换机端还是 GPU 端未来的解决方案，都能提供较大帮助。此举可以看作是英伟达对 CPO 领域的早期布局，既不影响当前产品的更新迭代，又能提前锁定核心供应商和资源，为其未来转向 CPO 提供支持。这种做法与之前在 HBM 领域锁定整个产业链的策略相似，表明英伟达对 CPO 方向非常看重。

在 Meta 与 AMD 达成 1,000 亿美元协议后，今明两年 MI 系列向 Meta 的交付预期是否有明显提升？

该协议并未对 MI455 的交付节奏带来太大影响。Meta 当前优先想获取的是 MI450，以解决其迫在眉睫的 GPU 短缺问题，并且主要将 AMD 产品定位于推理应用。Meta 认为 AMD 的产品目前还无法在训练场景中扮演更重要的角色。因此，MI455 是其后期的关注点，而非前期的主要目标。Meta 当前的核心是解决眼下的推理需求，而 MI455 这类能够对标 GB200/GB300 的高密度机架解决方案，涉及到产品一致性、集群使用率和软件生态等更复杂的问题，是 Meta 下一步才会关注的重点。目前了解到的情况是，Meta 与 AMD 在这一层面尚未进行深度配合。目前 MI450 的交付数量没有新的变化。Meta 与 AMD 签署的是一个上限为 20 万片的协议，确保为 Meta 预留这部分产能，但要求分期交付，并未要求一次性完成。该协议总时长为 4 年，计划在 2028 年完成，目前还剩下约 3 年的执行期。

Meta 是否取消了其自研芯片 MTIA 第三个版本 Olympus 的研发？未来在训练和推理端是否会更依赖 AMD 或英伟达？

Meta 并未完全取消 Olympus 的研发，而是对其优先级进行了调整。当前，Meta 将关注重点放在自研推理芯片的应用上，而将训练芯片的研发计划向后推迟。这一变化的原因有两方面：首先，Meta 目前拥有大量的训练资源（包括自建和租赁），足以保障其训练需求，同时认为自研训练芯片要实现对英伟达产品的完全替代难度较大；其次，Meta 内部硬件团队的稳定性不佳，人员流失严重，管理问题导致其认为即使推出自研训练芯片，效果也可能无法与英伟达形成替代关系。因此，Meta 选择将资源倾向于与 AMD、谷歌等厂商合作，以快速满足现有需求，同时围绕其更有把握的自研推理芯片继续推进。

OpenAI 与 AWS 近期额外拓展了 1,000 亿美元的合作，其中对 GB/VR 系列、Trainium 3 和 Trainium 4 的需求增量是如何分配的？

这次合作的大部分增量需求将分配给 Trainium 3 和 Trainium 4，而给英伟达的增量并没有太大变化。OpenAI 发现 Trainium 3 和 Trainium 4 经过快速适配后，在其使用场景中效果不错。由于 OpenAI 掌握其模型的底层逻辑，了解模型对硬件的具体需求，因此认为 Trainium 3 和 Trainium 4 的架构在加速逻辑上与其当前需求更为契合。此次增资并未对 AWS 与英伟达原有的协议带来显著变化，原合同体量基本维持不变。同时，OpenAI 也未向 AWS 明确提出要求将这笔投资用于采购更多的英伟达产品。

这笔新增投资大概对应今年多少张 Trainium 芯片的增量？

这笔投资是分阶段实施的，并非最终的确定数字。根据 AWS 方面的信息，由于 OpenAI 的增资和新需求，他们计划提前 Trainium 3 和 Trainium 4 的整体节奏。在 Trainium 3 这款产品上，计划将规模扩展约 20 万至 25 万张卡，上限甚至可能达到 40 万张卡。这是一个近期的数字，后期是否会随着资金的分阶段投入而有更大规模的叠加，目前尚不确定。

OpenAI 和微软方面对于 2026 年 MI355 和 MI450 的需求是否有更新？

目前没有更新。微软要求 OpenAI 提供明确的需求才会进行相应部署，但 OpenAI 方面并未提出明确要求。这主要是因为 OpenAI 现在除了微软，还有其他几家合作方也陆续引入了 MI450，使其拥有了多家供应商的选择方案，因此不愿意向微软单方面做出承诺。鉴于双方协议的严格执行性，OpenAI 不愿给出明确需求，微软也因此不愿投入，导致新增协议的推进陷入僵持。目前，微软仅在落实此前已达成的协议，对于 OpenAI 提出的新想法，微软坚持要求对方提供明确订单后才会推进。

近期 OpenAI 的投资预期调整是否影响了其自研 AI 芯片的进度？

OpenAI 自研芯片的进度已经延后。公司近期获得的资金主要用于支付前期数据中心的交付款项，没有额外的资金空间投入到芯片研发中。当前，OpenAI 的优先事项是完成大量数据中心的交付并确保其充分利用，自研芯片的优先级已相应降低。从博通方面也了解到，OpenAI 目前并未催促进度，芯片交付的排期也并不紧迫。

两个月前 OpenAI 宣布 “Code Red” 后，其团队及策略上是否看到显著变化？

“Code Red” 最初意在表明公司有紧急的策略转向。之后，公司确实进行了一些策略调整，包括大规模招聘高水平人才和调整团队架构。然而，目前来看，其策略仍不明晰，并且当时大力招聘的人才中，已有相当一部分再次流失，人员流动性很大。从模型推出的节奏来看，“Code Red” 的主要原因是其模型在多方面开始落后，且整体战略不清晰导致资源过度分散。公司现在也过多地强调未来的盈利和市场化能力。这些变动最终能带来何种效果尚不明确，市场上对此也存在相当大的疑虑。总体来看，“Code Red” 并未从根本上解决其在人员、战略、市场和资金方面面临的问题，效果不明显。

xAI 自研 AI 芯片的进展如何，是否已经投片？

xAI 的自研芯片至今尚未投片。其进度原先比 OpenAI 稍晚，但现在时间点已基本与 OpenAI 拉齐。预计可能在 2026 年第二季度到第三季度投片，但具体代工厂尚未最终决定，目前在与台积电和三星同时洽谈。考虑到该项目近期的一些动荡，包括原芯片设计团队与 SpaceX 的合并以及新架构的调整，最终投片时点可能在 2026 年下半年，回片时间大约在 2026 年底，预计 2027 年有可能实现量产。

微软的 Maia 200 芯片是否会完全在 IFS 的 18A 工艺上生产，并于下一季度实现量产？

这款产品并未在英特尔的 18A 工艺上进行生产。根据 18A 团队的反馈，其生产线上至今未见到微软的任何产品。主要原因在于，该芯片最初的制造工艺完全围绕台积电的三纳米工艺展开，包括近期回片的样品。若要转换至 18A 工艺，将面临巨大的后端设计调整，而微软目前不具备这方面的能力，且不计划为此额外支付费用。微软的意向是未来由英特尔承担这部分工作，但英特尔目前缺乏相关人力，且其 18A 工艺的后端设计库尚未成熟。因此，目前的情况是微软将决策权交给了英特尔，待其具备承接能力后再议。在此期间，Maia 芯片仍在台积电生产，现有产能足以满足其尚未大规模上量的需求。英特尔何时承接该项目，取决于其 18A 工艺的成熟度以及能否在成本上与台积电对标，否则微软不会为此买单。

有说法联发科向 IFS 下达了 TPU v8e 的 EMIB 订单，其订单量和收入贡献时点如何？

联发科确实下达了该订单，但预计要到 2026 年下半年才能执行。原因是英特尔已将 EMIB 产能转移至第三方，需等待第三方完全掌握整个流程后才能量产。联发科给出的初步数字约为 60 万颗，但这并非确定数字，最终能否达成取决于 EMIB 的最终成本和产能。这 60 万颗更像是一个预估的缺口，能否被满足还要看台积电的封装厂后期扩产能否承接新订单，以及英特尔委托的第三方能否按时满足客户要求并控制成本。目前存在较大变数，预计至少需要再过一个季度才能看到更详实的数据。

有说法腾讯向寒武纪下达了 3-6 万张 690 芯片订单，属实？

这并非一个有明确交付时间点的正式订单，只是提出了一个需求，但并未给出具体的交付节点。目前已知的是，腾讯近期会有一个基于 590 芯片的小批量采购，但后续的放量节奏尚未确定。腾讯在算力卡方面并不紧张，其今年（2026 年）还有几万张昆仑芯等厂家的卡的交付计划。因此，需要关注最终的实际交付能力，因为腾讯给出的采购预测往往不代表最终的实际采购量，其过往常有给出较大预测以确保供应商产能，但最终仅小批量交付甚至拖延一年不交付的情况。

DeepSeek V4 模型在适配上是否优先选择昇腾和寒武纪，并刻意避开英伟达？其迟迟未能上线的原因是什么？

DeepSeek V4 在推理适配方面确实优先与昇腾和寒武纪合作。这主要是因为 DeepSeek V4 要求原生支持 FP8，而目前能够原生支持该数据格式的只有寒武纪和昇腾。其他厂商的 FP8 支持并非原生，而是通过 FP16 兼容实现，或者在产能上无法满足 DeepSeek 未来大规模部署的算力需求。因此，这两家成为首选合作方，而壁仞、昆仑芯、摩尔线程等属于第二梯队的适配厂商。目前，各家厂商的适配工作已基本完成，但优化工作需等待 V4 最终版本发布后才能进行。V4 发布时间滞后的主要原因在于其集成了多项重大的技术改动。每一项改动都对模型的性能、成本及客户使用体验产生显著影响，导致团队需要进行反复的技术验证和评测，从而明显推迟了发布进程，但近期有望发布。

温馨提示：内容源于第三方以及公开平台，仅供用户参考，恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理（微信：_LYSD_）。