登录路演时代
忘记密码
忘记密码
忘记密码
欢迎注册路演时代
已有账号?马上登陆
海光调研:深算三号与寒武纪 690 及昇腾 950PR 对比,最新供需状态,深算四号以及未来与摩尔线程、沐曦竞争预期
发布来源: 路演时代 时间: 2026-04-23 13:29:11 0

海光调研:深算三号与寒武纪 690 及昇腾 950PR 对比,最新供需状态,深算四号以及未来与摩尔线程、沐曦竞争预期


1, 海光 DCU 当前的供需状况如何,尤其是在晶圆产能与封装等环节存在哪些瓶颈?同时,从需求侧来看,其客户构成是怎样的,2026 年以来哪些客户的需求出现了显著变化?

2026 年,海光深算三号 DCU 的两个版本销量均受限于产能瓶颈,市场需求远超供给。目前,支持互联的 DCU 升级版已基本被大客户预订完毕,供应给 OEM 渠道的主要是阉割了互联功能的 BW100 等型号。只有当 OEM 客户有具备行业示范效应的特殊项目时,才可能通过特别申请获得少量高端型号。整体而言,DCU 产品在 2026 年处于 “产能即销量” 的状态。从客户需求来看,国内几家主要客户的核心业务场景部署是关键驱动力。一旦这些场景开始规模化部署,现有十几万至二十万片的产能将远不能满足需求,导致客户争相预订。其中,视频生成推理是当前最大的锚定应用场景。海光 DCU 是截至 2026 年第三季度,国内市场唯一支持 FP8 且单卡配备 144G 显存的通用 GPGPU,并在海光与曙光的系统内支持 8 卡、16 卡、40 卡等全规模的互联架构,这在视频生成领域构成了显著的竞争优势。大显存与全互联架构直接影响视频生成的时长、分辨率和帧率等关键指标。受此影响,其他客户获取高端型号变得困难。因此,DCU 及 DCU 升级版的销售前景主要取决于产能释放,而边缘型号则流向其他 OEM 客户。


2, 关于海光 DCU 在 2026 年的产能规划,总出货量预计能达到什么水平?其中,不支持互联的降级版本产品占比预期?

根据专家个人判断,2026 年海光 DCU 的总出货量预计将显著高于市场预期的二三十万片水平,预估至少在此基础上提升 50% 以上。在这些产品中,不支持互联的降级版本占比较低,预计不到总量的 10%。这类产品通常是芯片生产过程中互联模块出现问题的次品,由于互联模块本身的良率很高,因此这类降级芯片的产出比例本身就很低。目前,这类产品主要是因为高端型号已被大客户预订,才提供给 OEM 渠道。


3, 在海光 DCU 的供应链中,HBM3 内存的供应是否会成为影响出货节奏的瓶颈?

HBM3 的供应不会对海光 DCU 的出货节奏产生影响。海光的 HBM3 供应非常充足,这得益于其自 2020 年起就与三星建立了极为良好的合作关系。目前来看,唯一的限制因素在于中芯国际的晶圆产能。


 4,针对您估计 2026 年三四十万片 DCU 产能,主要来自国内,相应在客户层面的大致分配预期?

2026 年预计的三四十万片是对外销售的口径,该数据已扣除为超算项目预留的产能。在对外销售的部分中,DCU 升级版已被大客户全部预订,而腾讯因无法获得升级版,只能采购标准版 DCU。剩余的少量降级版本产品则主要供给政企行业等小客户,因为大模型应用普遍需要互联功能。在产能来源方面,这三四十万片主要由中芯国际生产,其中 DCU 升级版占比较多,标准版 DCU 较少。此外,三星也会提供少量产能作为补充。


5, 对于大客户,DCU 升级版的交付节奏通常是怎样的?GPU 产品的交付节奏与 CPU 不同,互联网客户通常会先签订合同,然后按照约定的节奏分批供货,其模式与其他厂商的订单交付类似。DCU 升级版在视频生成领域的应用具备高度稀缺性。首先,在国产 GPU 中,目前没有其他产品能满足该场景的需求。此前,这类客户曾使用过基于 5090 改造的 96G 显存魔改卡,但这些产品质量无保障且不具备互联功能,单卡渠道价格高达 6 万元左右,成本效益不佳。由于缺乏合适的国产产品,且使用英伟达的企业级显卡成本过高,导致该业务领域一直存在产品缺口。海光 DCU 升级版的出现正好填补了这一市场空白。


6, 海光深算三号 DCU 升级版目前的市场反馈?

市场对 DCU 三号升级版的需求强烈,尤其是在视频生成等产品稀缺性强的应用场景。


7, 如何看待海光深算三号 DCU、寒武纪 690 和昇腾 950 这三款产品的市场定位与应用方向?

这三款产品面向不同的业务方向,不构成直接竞争。海光 DCU 三号升级版主要用于 C 端视频生成推理 (专家估计,仍需要进一步确认);寒武纪 690 主要支持大语言模型推理,例如豆包这类应用;昇腾 950 则主要用于字节跳动内部的搜索、广告和推荐等业务。


8, 考虑到 2026 年下半年才开始规模出货,刚刚估计的海光 DCU 全年三四十万片的出货目标是否存在困难?

其实上游晶圆产能分配的核心逻辑是:订单规模决定产能获取能力。厂商凭借明确的客户订单,尤其是来自大型互联网公司的订单,向工信部等机构申请并确保相应的晶圆产能。例如,寒武纪之所以能获得较多产能,是因为其手握大量订单。同理,海光也正凭借其客户的预定订单去争取产能。因此,只要订单确认,下半年实现目标出货量是有确定性的。


9,2026 年下半年国产 GPU 市场预计会出现哪些具有竞争力的新产品?这些新产品将如何影响市场格局?

2026 年下半年,市场将迎来一批从三星 4nm 工艺流片回来的高性能芯片,这将是到 2028 年之前国内能获得的最好工艺。这些产品包括海光的深算四号、摩尔线程、以及字节等。这些芯片将直接集成最高规格的 HBM,容量可达 288GB。届时,市场竞争格局将发生变化,拥有这些稀缺性、强竞争力产品的厂商将采取类似分货的模式,直接向大型互联网客户供应,而不会经过传统的 OEM 渠道。


10, 在三星 4nm 工艺的产能获取上,海光、字节、摩尔线程等公司的进展和优势分别是什么?

在三星 4nm 工艺的流片进程中,海光的进度最为领先,比第二名快至少 2-3 个月。海光与三星有深厚的合作历史,项目启动早,且资金充裕,因此能够确保相当规模的产能。字节虽然量可能也很大,但对于字节的第一代自研芯片,在芯片点亮并验证架构前,不敢下批量订单,目前仅能预定产能,量产存在不确定性。摩尔线程则主要为腾讯服务,同时也在自行投入流片。寒武纪的进度相对最慢。


11, 海光深算四号芯片销售前景?

深算四号的首要目标是发布 192 卡的超节点产品,初期可能更侧重于展示技术实力和市场领先地位,不一定急于大规模出货。在客户分配上,会优先考虑在 DCU 三号升级版采购和提货方面表现良好的客户,例如字节跳动等大型互联网公司。由于该产品在 2028 年前都将是稀缺资源,销售前景非常乐观。


12, 如何看待字节、阿里、腾讯等互联网巨头在 AI 芯片的需求差异?

字节跳动作为全球最大的视频平台,其核心商业模式与视频生成技术高度契合,因此对海光 DCU 这类适用于视频生成的通用 GPU 需求非常迫切和明确。相比之下,阿里和腾讯更关注于 Agent 和下一代互联网入口的争夺,其核心在于大语言模型,这类应用不一定需要通用 GPU,也可以通过自研的非 GPU 芯片实现,性价比可能更高。因此,阿里在采购外部通用 GPU 时表现得较为犹豫,更倾向于依赖其自研芯片,对抢购 DCU 的意愿不强。未来市场竞争的核心将是互联网入口的争夺,而非固守于使用自有芯片。随着手机智能化发展,用户对设备的操作能力和知识广度在下降,预计未来 80% 的用户将主要通过 Agent (如豆包、元宝、千问) 进行交互,而非直接操作。因此,互联网入口的竞争将变得异常激烈,在这场竞争中获胜至关重要,失败的损失将是巨大的。届时,大厂关注点将集中在如何赢得入口,而不是单纯考虑使用哪家芯片。


13, 曙光与海光的超节点产品应用方向、当前客户情况以及市场推广策略是怎样的?

曙光与海光已有量产的超节点产品。上个月 (2026 年 3 月) 发布了一款 40 卡超节点,其特点是体积小、部署要求低、成本也较低,每套价格约 1000 万元。曙光计划在其擅长的金融、电力、政务、教育等行业推广这套产品的私有化部署,预计 2026 年将有至少大几十套的部署量。作为国有控股公司,曙光与海光在市场策略上需要兼顾出货量和行业影响力。因此,尽管约 90% 的销量可能集中在互联网客户,但剩余 10% 的产能会被有策略地分配给各行业的示范性项目。这些项目虽然量不大,但目标是覆盖每个行业、每个区域和每种类型的客户,以建立广泛的案例和市场声誉。这种策略平衡了实际出货量与汇报时展示的行业覆盖广度。


14, 三星为国内厂商开放流片渠道的潜在原因和风险是什么?

三星之所以开放流片渠道,可能是因为其有大量 HBM3 库存积压,需要通过为这些需要 HBM 的芯片流片来变现。此举很可能是在与美国方面沟通后开设的窗口。然而,这个窗口期存在不确定性,随时可能关闭。因此,当前针对深算四号的策略是尽可能先囤积产量,再根据市场需求决定宣发和发布的时机。如果三星渠道对国内关闭,预计将影响所有通过在三星流片的厂商。


15, 深算三号和深算四号在 2026 年的交付与发布节奏是怎样的?

深算三号预计在 2026 年第二季度末开始批量交付。基于市场策略考量,深算四号在 2026 年可能不会急于推出,因为仅凭深算三号及其升级版就足以完成今年的出货目标。深算四号可能会在 2026 年第三或第四季度以超节点的形式进行宣传发布,但并不销售单卡或模组,以维持市场热度。


16, 沐曦的 C600 产品目前的技术状态和市场定位?

沐曦 C600 采用 N+1 工艺,是一款双 Die 产品。每个 Die 挂载两颗 HBM3,显存为 72GB。由于两个 Die 之间的 Die-to-Die 互联调试不顺,实际表现为一张卡上有两个独立的计算核心。因此,在一台 8 卡服务器中,它会被识别为 16 个 72GB 显存的 “小卡”,而非 8 个 144GB 显存的大卡。这种架构在应用上会受到很多限制,因为它没有 Switch。该产品最初的市场策略是押注在海外先进工艺以及国内 N+2 产能紧张时,凭借 N+1 工艺相对充足的产能获得市场机会。但目前随着 N+2 以及三星渠道的放开,C600 未能抓住预想的市场时机。


17, 在三星 4nm 产品进入市场后,国产 AI 芯片的市场格局将预期?

沐曦、摩尔线程、海光这三家通用 GPGPU 厂商都在三星进行流片。如果他们的流片进展顺利,并且三星的供应窗口期足够长,那么在 2026、2027 及 2028 年,国产市场可能会被通用 GPGPU 架构统一。在这种情况下,昇腾和寒武纪等非通用 GPGPU 路线的产品将面临严峻的竞争压力。


温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)。