1、大模型行业收入增长逻辑变化
收入函数变化趋势:2025年及此前市场普遍存在担忧,国内大模型正快速追赶海外模型,能力边界已变得越来越长,但行业商业化路径仍不够清晰。2026年初各类AI政策落地,叠加Co-worker、包含OpenAI小龙虾等在内的新形态AI产品出现,Coworker消耗增速持续加快,付费Tokens正在起量,领先模型厂商凭借强性能逐步掌握定价权。在此背景下,大模型厂商收入可能从此前的线性扩张逐渐转化为非线性扩张,增长函数从线性增长转为上凸函数,现阶段厂商收入会加速增长。
2、头部大模型厂商2025年财务表现
智谱2025年财务数据:智谱2025年实现营收7.2亿元人民币,同比增长132%。营收拆分来看,上半年营收1.9亿元,下半年营收5.3亿元,下半年收入为上半年的2.8倍,主要有两方面原因:一是2025年公司以B端本地化收入为主,本地化部署收入占比达74%,涵盖企业级通用大模型部署、企业级智能体部署两类业务,这类大型项目下半年回款较多;二是下半年API收入增长快速。盈利层面,2025年公司毛利为41%,较2024年下降15个百分点,主要原因一是云端API收入占比提升,二是本地化业务尤其是企业级通用大模型业务毛利率阶段性下降,需求多样化导致交付成本上升。亏损及投入层面,2025年公司经调整净亏损为32亿元,同比扩大接近30%;当期研发开支达32亿元,同比增长45%,经调整净亏损规模基本与研发开支相当。
MiniMax2025年财务数据:MiniMax2025年实现总营收7900万美元(约合5-6亿元人民币),同比增长接近160%,超过70%的收入来自海外。盈利层面,2025年公司毛利为25.4%,同比提升13个百分点。亏损层面,2025年经调整净亏损为2.5亿美元,同比微幅扩大,但经调整净亏损率同比大幅收窄,2024年经调整净亏损为2.4亿美元,2025年亏损规模基本与2024年持平。投入层面,2025年公司研发开支为2.5亿美元,与智谱特征一致,剔除高研发投入后,业务毛利已基本能够覆盖销售和管理费用。
3、API业务增长情况与驱动逻辑
智谱API业务增长情况:智谱API收入实现高速增长,收入结构呈现显著优化。2025年智谱API收入达1.9亿人民币,2024年该收入不足0.5亿,同比增长3倍,收入占比提升至25%以上,占比上涨10余个百分点;其中2025年下半年API收入同比增长430%,远超私有化部署57%的增速,推动公司商业模式从偏重资产的项目交付制转向轻资产、标准化的API模式。2025年API毛利率升至19%,较此前提升15-16个百分点,已脱离早期几乎不盈利的阶段,进入效率改善与规模放大的正循环。2026年2月智谱API服务ARR达17亿人民币,较年初增长6倍,较2025年同期增长60倍。开发者生态建设快速推进,扣丁派付费开发者规模达24万,TOPS交易量6个月增长15倍;2026年3月推出的小龙虾相关订阅计划上线20天订阅用户突破40万,验证了Agent长链路任务的商业潜力。预计2026年底API ARR有望达10亿美金,2026年API服务与本地化部署收入预计各占一半,后续2-3年业务重心将进一步向API倾斜,可覆盖海量中小客户与长尾场景,增长空间广阔。
MiniMaxAPI业务增长情况:MiniMax API相关业务同样实现快速增长,收入占比持续提升。2025年MiniMax开放平台与企业服务收入接近2600万美元,同比增长近2倍,收入增速快于AI原生产品,收入占比提升至33%;其中2025年Q4 API收入超1000万美元,收入占比达40%以上。截至2026年2月,公司整体ARR(含AI原生产品、开放平台与企业服务)突破1.5亿美金,增长核心驱动力来自ToC消耗提升:2026年春节前后发布的M2.5基础模型带动Tokens调用量快速增长,2026年2月M2系列文本模型单日消耗量是2025年12月的6倍以上,其中Coding Plan的TOPS消耗量增长超10倍,付费TOPS实现快速增长。预计2026年MiniMax API收入占比可达40%-50%,增长前景向好。
其他厂商增长佐证:未上市大模型厂商普遍实现爆发式收入增长,行业付费客户数量呈指数级增长态势。某未上市厂商2026年发布的P2.5大模型代码能力突出,发布不到20天累计收入已超过2025年全年收入;Kimi大模型获海外市场高度认可,海外收入已反超国内。
API增长核心驱动逻辑:API业务的高速增长核心源于Agent类应用对Token消耗的放大效应,市场此前对大模型商业化的低估主要源于未充分认知该效应。普通聊天场景单次问答消耗有限,收入与用户活跃度强相关,但进入Agent模式后,Token消耗将出现指数级跃升,核心来自三方面:
a. 多轮自我修正:以代码类任务为例,Agent会经历写代码、运行、报错、修改、再运行的数十个回合,每个回合均需完整调用模型,消耗规模大幅提升;
b. 上下文膨胀:Agent为保留历史操作信息,每次调用均需携带大量对话历史,进一步抬高消耗;
c. 多工具调用:Agent执行整理邮件、创建待办等任务时,单次可触发5-10次API调用,每次调用均携带完整上下文。
相关测试与实际使用数据也验证了高消耗特征:海外博主极限测试显示,使用相关Agent模型24小时不间断运行,单月成本可达800-1500美金;实测跑相关Agent任务6-7小时,消耗约4000万Tokens,对应成本约四五元人民币,Token消耗规模远高于普通场景。
4、大模型行业定价逻辑变化
行业定价策略转变:2024年大模型行业整体采取以价换量的竞争策略,通过降价抢占用户与市场份额,多数厂商将产品价格压至极低水平,甚至接近免费。当前大模型已逐步升级至生产力级别,最新发布的GLM-5.1在长链路任务上提升显著,单次任务可持续工作超8小时,可交付工程级成果。进入2026年,不同厂商的大模型性能逐步拉开差距,尤其在代码场景、Agent相关能力层面的差异逐步显现,行业开始从单纯的价格竞争转向基于技术实力和实际价值的价值定价,整体价格体系正处于重建阶段,头部厂商凭借领先的模型性能逐步掌握定价权,开始体现能力溢价。
智谱是该趋势下的典型代表,其在不到2个月的时间内完成三次提价,累计涨幅达83%:a. 2026年2月12日,推出新一代GLM-5 Moonshot模型,对Calling Plan套餐进行整体提价,涨幅30%起;b. 2026年3月中旬,发布针对小龙虾场景的GLM 5 TurBOE模型,再度将API价格上调20%;c. 2026年3月2日,发布GLM-5.1模型,第三次提价10%。提价后智谱的产品需求并未收缩,反而呈现供不应求的状态,2026年一季度其API调用量同比增长达400%,充分验证头部大模型厂商已具备基于产品价值定价的能力,行业定价逻辑正向良性方向发展。
5、行业核心结论与投资观点
趋势总结与标的推荐:大模型行业多维度发展趋势明确,商业化前景向好。其一,行业增长动力充足,2026年AR持续跃升,托克消耗保持高速增长,付费投控维持非现金增长态势,模型厂收入有望继续超预期。其二,API收入成为行业核心增长引擎,智谱API的ARR(SaaS)已达17亿人民币,预计2026年底将达到10亿美金;MiniMax的API收入在2025年下半年增长迅猛,2025年Q4其API收入占比已达40%,行业商业模式逐步清晰,正向更标准化、可复制、弹性更高的云端服务模式演进。其三,行业定价逻辑逐步转变,2024年以加快市场拓展为主,2025年已逐步转向凭借能力获取更高定价,典型案例为政府一季度累计提价83%后,电量仍增长10%;未来随着高复杂度agent任务持续放大客户消耗,模型能力真正转化为客户ROI后,领先模型厂商有望建立类似高端软件或云基础设施的定价权。智谱与MiniMax两家大模型公司在A股乃至全球股市均极具稀缺性,小龙虾浪潮也让全球众多开发者认知到国内大模型的高性能与高性价比,持续看好智谱与MiniMax的发展。
温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)。