调研核心:2026 年国内大模型及 Agent 发展预期、AI Coding 领域竞争格局、API 价格趋势、稀疏模型演化趋势
聚焦企业:阿里(通义千问)、字节跳动(豆包)、Kimi、MiniMax、智谱 AI(GLM)、OpenAI、Anthropic
调研时间:2026/02/26
核心要点
2026 年国内大模型及 Agent 发展预期
互联网大厂与大模型创业公司在 AI Coding 领域竞争预期
国产模型 API 价格变化预期
稀疏模型演化趋势
以下为专家观点,仅供参考,不构成任何投资建议。
1、从 2026 年 1 月底至 2 月,国内外大模型密集发布更新,其中哪些更新对行业影响较大?特别是对阿里巴巴后续的模型迭代或产品更新可能产生哪些显著影响?
2026 年 1 月至 2 月是模型发布的高峰期,国内外头部厂商均有动作,包括 OpenAI 的 GPT-5.3、Anthropic 的 Claude Opus 4.6,以及国内的豆包 2.0、Kimi 2.5 和 GLM-5 等,这些更新带来了几方面影响:首先,创业公司的竞争力显著提升。以 Kimi、智谱 AI 和 MiniMax 为代表的创业公司,其模型排名大幅跃升,从此前的行业前十末尾位置进入前六乃至前五。例如,GLM 在编程模型领域已位列前五。在 OpenRouter 等平台上,这些模型的调用量也大幅增长,Kimi 的周调用量接近 3 万亿次,显示出其在用量和排名上的双重突破。其次,在编程模型赛道,阿里巴巴的通义千问 3 面临激烈竞争。由于通义千问 3 的编程模型发布于半年前的 2025 年 9 月,而近半年其主要精力集中在更新底座模型 (如通义千问 3 Max 和通义千问 3.5 Plus),并未专门迭代编程模型。相比之下,智谱 AI 等新模型在编程能力上表现突出。目前,阿里巴巴正在研发下一代编程模型通义千问 3.5 Code,但尚需时间。第三,模型能力向多模态扩展成为趋势。与过去纯文本模型不同,2026 年发布的新模型普遍增加了视觉能力,实现了图片和视频理解。Kimi 2.5、MiniMax 以及阿里的通义千问 3.5 均加入了视觉模块,标志着多模态发展迈出了重要一步。第四,模型架构普遍采用 “超稀疏” 混合专家模型。行业在模型效率上取得了进一步优化。第五,模型开始普遍强调与 Agent 能力的结合。Kimi 推出了名为 Agent Swarm 的智能体集群,智谱 AI 的模型也增强了 Agent 能力,旨在通过推理和思考解决更复杂的问题。第六,国产模型与国产芯片的适配成为一个重要方向。智谱 AI 等厂商强调其模型能够支持华为昇腾、摩尔线程等国产芯片平台进行推理。通过在 OpenRouter 等海外平台分发 API,这些厂商可以利用国产芯片作为底层算力基础向海外市场提供服务,打通了 “国产模型 + 国产芯片” 的出海路径。最后,在定价策略上,市场出现分化。阿里巴巴对其 API 进行了降价,将最便宜的输入和输出价格分别调整至原先的几分之一。而智谱 AI、Kimi 和 MiniMax 则上调了 API 价格,这一举动获得了资本市场的认可,认为其模型能力已具备溢价空间,“API+SaaS” 的商业模式得到验证。
2、2026 年以来,除了模型层面的更新,行业在产品层面出现了哪些值得关注的新方向?
在模型发布的同时,一个重要的产品方向是 OpenClaw 的兴起。阿里巴巴、智谱 AI、字节跳动以及腾讯等头部厂商都相继发布了基于 OpenClaw 的产品。这一趋势标志着行业焦点从云端的基础设施和 API 调用,开始向端侧的个人代理 (Personal Agent) 转移。OpenClaw 最初面向需要通过命令行部署的资深开发者,使用门槛较高。现在,阿里、腾讯、火山引擎等厂商推出了自己的一站式解决方案,而 Kimi、MiniMax 等也开始提供适配方案,旨在将 OpenClaw 转变为 C 端用户零门槛的 AI 执行入口。这种部署在个人 PC 或手机端的入口,将成为厂商绑定其底座模型和构建产品生态的关键。这一转变预示着 Agent 进入了 2.0 时代,即从 2025 年以对话式完成任务,演进为以任务执行为核心的 AI 入口。这个新赛道可以类比为过去对 APP 入口的争夺,现在转向了对 PC 操作系统级入口的争夺。OpenClaw 的应用场景非常广阔,基础功能包括文档整理、制作 PPT 和撰写报告;进阶场景可扩展至内容创作 (如写脚本、素材搜集、编辑发布),甚至渗透到销售管理、客户管理、市场拓展、金融盯盘与预警等更复杂的领域。预计从 2026 年第二、三季度开始,这类产品将逐渐普及,成为新的流量入口。
3、考虑到近期 Kimi、智谱 AI 等新模型在编程能力上的强劲表现,编程领域的后续竞争格局将如何演变?阿里巴巴若发布新模型,其编程能力是否能超越当前对手?
编程能力的竞争不仅是底层模型的比拼,更是模型产品化的竞争。资深开发者和工程师用户需要的不仅仅是模型 API 的调用,而是集成了模型能力的插件或类似 Copilot、CodeWhisperer 的完整工具。阿里巴巴自 2023 年起就在此赛道进行深度布局,面向国内企业推出了 “通义灵码”,同时也有针对海外及普通用户的产品,相应产品线覆盖了从专业工程师到普通用户的不同群体。虽然阿里巴巴当前模型的排名暂时落后,但其正在研发的通义千问 3.5 本身就包含了对编程模型底座的升级。其节奏是先完成 3.5 底座模型的迭代,再推出专项的编程模型,新模型发布后,其在各项评测榜单上的排名预计将得到刷新。因此,尽管智谱 AI 和 Kimi 等模型在当前阶段暂时领先,但市场格局并非定局。
4、在编程这一垂直领域,最终的市场格局预期,哪些公司或参与者类型 (例如互联网大厂或大模型创业公司) 占据领先地位的概率较大?
在编程赛道,头部的市场份额最终将由大厂占据。编程能力本质上是基础模型能力的一部分,大厂虽然不一定专门强调其编程模型的强大,但会抽调专项资源进行竞争。相比之下,创业公司通常使用其自有的底座模型来支持代码生成功能。从资源投入的角度看,大厂能够在一个垂直赛道上集中投入,其资源和兵力与创业公司不在一个量级。此外,大厂在产品工程化以及为基础用户提供端到端体验方面有更深厚的积累。预计未来,大厂可能会占据市场四到六成的份额。目前,由于编程模型市场尚未形成如 Claude 般一家独大的收敛格局,仍处于持续发展阶段,因此个人开发者可能会同时选择两到三款工具。他们可能会试用头部的 Claude,将同一段代码交给其他工具编写,比较效果后选择最优的方案提交。这种使用方式也与成本有关,因为编程场景消耗的 token 量巨大,每日可达数十万甚至上百万,开发者会综合考虑进行选择。展望至 2026 年年底,随着模型的发展,市场可能会出现一定的集聚效应,头部百分之五六十的市场份额将由大厂掌握。对于 Kimi、智谱 AI 这类创业公司而言,尽管其编程模型能力很强,但仍存在发展空间。若想在编程赛道上扎根,它们必须构建出自己的产品体系。否则,其角色可能会被局限为底层被调用的模型,例如成为 Cursor 或 Copilot 的底层能力提供方。另一种路径是自主开发面向用户端的工具类产品,这或许是它们更可能选择的方向。对于长期使用的开发者而言,一个能够持续赋能的工具是必不可少的。
5、如果一家大模型公司在编程工具或产品上表现出色,这是否意味着其后续在 Agent 领域的发展也可能处于领先地位?
是的,编程领域的产品力可以看作是其 Agent 能力的前瞻。以 Anthropic 为例,其编程产品在 2026 年表现突出,这不仅得益于其强大的编程模型,更关键的是其整套 Agent 体系,包括 Claude Agent 和 Coworker 等产品,展现了强大的产品力。模型本身只是基础,需要获得开发者的认可;但要真正实现用户量的增长,必须像 GitHub Copilot 一样,提供具体的产品化形态来服务开发者。
6、如何看待国产模型 API 在海外市场广受欢迎的现象,其背后的原因是什么,以及未来的发展预期?
国产模型 API 在海外的流行主要通过 OpenRouter 这类平台体现。OpenRouter 本身作为一个模型聚合与分发平台,汇集了众多模型供用户选择和调用,但其背后的算力支撑服务是由各模型厂商自己提供的。这种模式下,存在一定的流量真实性风险。厂商可以通过技术手段自行刷高其模型的 token 消耗量,从而提升在平台上的排名,以获得市场优势。尽管如此,这也间接证明了头部国产模型在海外确实拥有一定的用户基础。从定价上看,即使加上平台约 20%-30% 的提价,国产模型的整体价格仍然比 Claude 等海外主流模型更具竞争力,因此海外开发者会将其作为备选方案。不能完全相信平台显示的流量数据是 100% 真实的,要判断其真实的开发者接受度,需要观察其流量能否持续保持。至少需要再观察一个季度,看其能否维持当前的调用量水平,才能判断其真正的市场竞争力。
7、如何看待近期国产模型 API 价格上调的现象,以及未来 API 价格的整体趋势?
API 价格上调是合理的。首先,虽然部分模型是开源的,但其背后的算力、存储、推理和带宽等基础设施都需要平台方自己投入硬性成本来支撑。其次,提价也是厂商证明其模型能力已经达到一定水准、理应获得相应市场回报的一种方式。目前单纯销售 API 业务很可能仍处于亏损状态,提价是为了支撑业务运转,在保持不亏损的情况下获得一定收入。要真正实现盈利,定价策略必须向上调整,至少要达到海外头部模型 (如 Claude) 价格的二分之一左右,利润率才能逐步提升。目前的价格上调是第一步,市场对此接受度较高,认可其性能。后续发展的关键在于模型能力的持续提升,以及运维系统和算力支撑能否满足用户需求。例如,智谱 AI 近期就因服务不稳定、推理速度慢等用户投诉而公开致歉,这表明其后端的算力运维体系尚不足以支撑前端庞大的用户量,需要在基础设施方面进行补强。未来,API 价格预计会呈现一波提价趋势。以阿里为例,其策略是多模型矩阵。旗舰模型的价格会上调以保证利润率,而中小尺寸的模型 (如新推出的通义千问 3.5-plus,并非其旗舰模型) 则会降价,以此与竞争对手拉开差距。如果中小模型的价格与外部竞品相近,可能会导致客户流失,因此阿里的定价策略会在这两者之间进行权衡。
8、从通用大模型的竞争格局来看,像智谱 AI、MiniMax、Kimi 这类创业公司的通用模型,与阿里等互联网大厂的模型相比,中短期的竞争力体现在哪里?
当前行业的技术趋势是向全模态延伸,目前第一步是图像领域。在这条技术路线上,几家已上市的大模型创业公司凭借充足的资金和算力 (部分有国产算力支持),完全有能力与大厂一较高下。大厂虽然也在投入,但其业务线更为庞杂;而创业公司则能更聚焦于一两个核心产品线,因此具备一定的胜算。在模型矩阵的丰富度上,创业公司可能不及大厂,它们无法像大厂一样兼顾多种尺寸的模型。它们的策略更倾向于集中资源打造一款极致的头部模型。通用模型的发展已进入第三年,在这个牌桌上,创业公司仍然拥有一定的话语权。大厂在模型研发上也会遇到瓶颈,例如在提升性能或进行算法优化时,这为创业公司通过技术创新快速追赶提供了机会。这几家创业公司在一级市场融资后,手头都拥有百亿级别的资金,使其在与大厂的竞争中处于同一量级。虽然人员和算力规模不及大厂,但通过精打细算地使用资金,它们仍可以在赛道上保持领先,并与大厂在同一维度上竞争。此外,大厂的战略重心正在从单纯比拼模型能力转向寻找落地场景和应用入口。从 2026 年开始,模型更多是作为底座,大厂的主要方向是在此之上构建出更强大的应用场景。
9、近期有企业投诉国内大模型存在蒸馏行为,如何看待此类投诉的后续演化方向,以及在技术层面是否存在有效的阻挠手段?
海外大模型的使用主要通过两种渠道:官方渠道和分销商渠道。官方渠道对中国本土企业和个人开发者基本不开放,会通过 IP、邮箱、Google 账号等方式进行严格拦截。目前,主要通过 OpenRouter 等分销商进行模型转售的方式来使用,这种方式难以被直接封禁。然而,以 Claude 的母公司 Anthropic 为例,该公司当前估值高,资金充裕,其长期战略目标是在代码编程领域保持领先地位,因此对于中国市场并不急于开拓。面对日益增多的追赶者,Anthropic 必然会采取拦截措施以保护其市场份额。不过,这些措施属于企业行为而非法律制裁,虽然能对部分合作伙伴产生震慑作用,但仍存在多种技术手段可以规避,因此完全阻止蒸馏行为是比较困难的。
10、关于稀疏模型,目前专家的激活比例已降至个位数,未来这一比例是否会进一步降低?如果持续降低,将对模型推理效果产生何种影响?
稀疏模型中专家的激活比例未来确实会继续降低。模型中专家的数量在持续增加,随着专家数量的增多,模型的划分可以更加精细,从而能够更精准地激活处理特定任务所需的专家。预计在 2026 年上半年,头部厂商的模型激活比例将降至 3% 左右;到 2026 年下半年,该比例可能进一步降至 2% 上下。
温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)。