Agent快速发展下推理算力需求变化及国产卡应用节奏

MiniMax、智谱、Kimi、阿里千问、字节豆包、腾讯混元等对比，AI Coding领域竞争预期，Agent快速发展下推理算力需求变化及国产卡应用节奏

一、MiniMax、智谱及Kimi等与阿里、字节、腾讯大模型特点对比及潜在发展侧重

MiniMax模型

OpenClaw支持与兼容性好：是OpenClaw开源框架作者的官方推荐模型，在与苹果macOS的兼容上表现出色，能更准确地理解用户的IT操作类意图。
文生视频和语音能力出色：早期在海外的良好口碑主要源于文生视频和语音能力，这是Kimi和智谱AI无法比拟的优势。

潜在发展侧重：

深耕海外市场：持续优化模型在海外市场的表现，提升在海外用户中的接受度和市场份额。
多模态技术融合：将文生视频、语音能力与大语言模型进一步融合，提供更丰富的多模态交互体验。

智谱模型

代码能力领先：GLM - 5在日常代码编写、工程理解等纯代码能力方面表现突出，超越MiniMax M2.5、Kimi K2.5以及之前的Qwen3 Coder，是目前国内代码领域的领先者。
国产芯片适配能力强：强调其模型能够支持华为昇腾、摩尔线程等国产芯片平台进行推理，打通了“国产模型 + 国产芯片”的出海路径。

潜在发展侧重：

补足Agent能力短板：向Agent领域倾斜和发展，追赶Anthropic的步伐，提升通用智能体执行能力。
拓展行业应用：将模型能力与行业场景深度结合，如在金融、医疗等领域推出定制化解决方案。

Kimi模型

多模态能力突出：具备视觉理解能力，在涉及视觉任务的场景中表现领先。
Agent能力强大：推出了名为Agent Swarm的智能体集群，能够根据用户任务直接生成多个协作的agent，在agent任务构建能力上表现优异。
付费用户增长显著：付费率已超过字节免费用户的日活数量，用户认可度高。

潜在发展侧重：

强化多模态与Agent融合：持续推进基于VL加thinking能力的agent，拓展在复杂任务场景下的应用。
商业化变现：进一步提升付费用户比例，探索更多付费场景和增值服务。

阿里Qwen模型

模型矩阵丰富：拥有通义千问系列模型，覆盖不同规模和应用场景的需求。
开源优势明显：千问的开源多模态模型已对字节系产品产生影响，开源模型在多模态生成领域具备优势，能够满足创作者创造自有IP的需求，避免版权问题。
生态闭环构建领先：依托自身生态，按照场景使用频率分阶段接入Agent，在整个生态的丰富程度上处于国内领先地位。

潜在发展侧重：

深化Agent生态建设：继续推进千问Agent的集成和互联互通，接入更多高频生活服务场景和第三方应用，实现从搜索浏览到下单购买的完整流程闭环。
自研芯片发展：推进自研芯片生产，提升芯片性能和市场竞争力，实现内外销售比例调整，为后续上市做准备。

字节模型

商业化能力强：将AI技术与广告、电商等业务紧密结合，在AI云服务的MaaS层以低价策略争夺市场份额，PaaS层重点放在Agent上，利用生态内的结构化数据为用户提供服务。
多模态技术布局：文生视频模型SeeDance 2.0在全球范围内表现优异，尽管领先地位可能是短期现象，但显示了字节跳动在多模态技术领域的研发实力。
用户基数庞大：拥有抖音、今日头条等海量用户平台，能够快速将AI产品推向市场，实现用户渗透。

潜在发展侧重：

提升基础模型能力：加快豆包模型的迭代升级，解决在自主强化学习技术栈推进1T以上模型时遇到的不稳定性问题，提升其在原生多模态、端到端等技术指标及编程能力方面的表现。
拓展Agent应用场景：在PaaS层衍生出更多面向中小企业的分场景服务，将Agent能力赋能广告和电商效果分析等业务。

腾讯模型

生态资源丰富：拥有微信、公众号、搜狗、腾讯视频、腾讯会议等强大的内部生态资源，AI工具可以打通这些生态资源，实现生态内的互联互通。
混元模型多模态能力：混元的生图和生视频能力一直表现良好，但近期更新速度有所放缓。
战略调整加速追赶：通过引入OpenAI的人才，复刻了类似的快速追赶路径，在AI领域的资源投入力度空前（后续在产品层面可能会给到市场惊喜）。

潜在发展侧重：

生态整合与Agent发展：将混元模型（包括DeepSeek开源模型）与微信、元宝等产品深度绑定，构建以自身生态为中心的Agent入口，探索生态内的商业化变现模式。
提升模型通用能力：加大对混元大语言模型的研发投入，提升其在通用知识问答、多模态交互等方面的能力，缩小与行业头部的差距。

二、AI Coding领域竞争预期

海外市场格局：Anthropic的Claude code在代码领域已形成明显优势，市场占有率超过90%。其在生产力领域形成了增长飞轮，通过与IDE工具配合使用，获得了来自实际工程环境的强约束反馈，使得用户反馈与大模型增长之间形成正向循环，其他厂商难以复制其成功模式。
国内市场现状与趋势：目前国内尚未出现类似Claude code这样可靠且占据主导地位的产品。主流大模型厂商仍聚焦于通用基座模型的研发，未能将其模型能力转化为标准化的Coding类产品。但未来国内市场机会主要在于大型厂商，大厂可将云服务优势与编程服务、通用AI智能体提效服务相结合，实现应用的一键发布与云端托管，打通后端云基础设施。

注：一直有专家认为由于人才的流动性，在模型技术方面不会存在6个⽉以上的持续领先性，但现实中由于不同公司组织架构、文化、发展侧重首先会对大模型人才的打开方式会有较大影响，其次才是模型架构、数据、训练方式等，所以个人认为单纯通过人才流动方式短期内拉平大模型技术或通用大模型能力的路径在实践中可能并不现实。

三、大模型蒸馏等技术对竞争影响

蒸馏技术的应用

模型蒸馏在业内已是公开的秘密，国内厂商和海外的Anthropic等公司都会采用蒸馏技术来提升模型能力。普遍做法是将全球顶尖模型在各自擅长的领域作为打分使用，如在代码领域利用Claude进行关键打分，在多模态领域利用Gemini进行强化反馈，从而训练出一个综合能力更强的模型。

对应积极影响：蒸馏技术可以帮助厂商在短时间内提升模型在特定领域的能力，如纯代码编程、通用知识问答或图像辅助标注等，缩小与领先模型的差距。

局限性：蒸馏无法解决需要强化反馈的核心问题，如在SWE - bench这类通用智能体执行榜单中，模型需要真实地解析和解压本地文件，并操作CPU执行一系列步骤，这些任务的完成情况需要通过搭建大量沙箱环境进行验证和反馈，蒸馏技术难以复现这一过程。

四、Agent市场发展预期

市场规模快速增长：2026年，AI Agent的发展呈现加速态势。以阿里巴巴为例，其自2025年12月起便开始分阶段进行Agent的集成，预计到2026年底，头部厂商将基本完成以自身生态为中心的Agent入口构建，市场焦点将转向不同厂商Agent生态之间的互联互通。
竞争格局分化：

大厂优势：大厂凭借其云服务、生态资源和端云协同能力，在Agent市场竞争中占据有利地位。例如，阿里、腾讯等大厂可以将Agent能力与自身的电商、社交、办公等生态深度融合，为用户提供一站式服务。

大模型公司机会：创业公司如Kimi、智谱AI和MiniMax在专项领域模型技术上具备一定优势，可通过快速将模型能力产品化，抢占用户入口，建立先发优势。但长期来看，大厂有望凭借其综合优势实现追赶甚至超越。

应用场景拓展：Agent的应用场景将从当前的办公、编程等领域，逐渐拓展到工业、医疗、金融等更多行业。

五、国内推理算力需求预期

算力需求持续增长：随着AI Agent的发展和多模态应用的普及，国内推理算力需求将呈现指数级增长趋势。以千问为例，当千问的日活跃用户为1000万时，大约需要2.6万张H20级别的计算卡；当DAU接近1亿时，理论上需要约25 - 26万张H20级别的卡来支撑（阿里专家估计，但伴随核心使用场景改变，相应估算需要进一步调整）。字节跳动的SeeDance 2.0文生视频业务原计划的算力资源预计可使用至2026年底，但根据当前的增长趋势和付费率，这些资源最多只能维持到6月份，算力缺口明显。
算力供需紧张：2026年AI算力市场整体仍将处于供不应求的紧张状态。从需求侧看，千问、豆包、元宝等C端应用的发展以及Agent、多模态等业务的拓展，对算力的需求巨大；从供给侧看，在英伟达产品无法进入的情况下，国内各厂商的总供给量合计约在300-400万张，可能仅能满足市场一半多一点的需求。GPU、存储、CPU等计算资源将持续紧缺，与之配套的交换机等设备也将成为市场热点（如近期昇腾上游产业链的爆发）。

六、国产卡在模型训练及推理领域应用预期

推理领域份额逐渐扩大：国产卡在推理领域的应用取得了一定进展。例如，智谱AI等厂商强调其模型能够支持华为昇腾、摩尔线程等国产芯片平台进行推理，通过在OpenRouter等海外平台分发API，利用国产芯片作为底层算力基础向海外市场提供服务。在搜广推等非生成类业务中，国产GPU与英伟达GPU的差异不大，具备良好的性价比和替代能力。虽然目前在大部分推理场景更多仍在使用5090类NV卡，但以昇腾为代表国产卡占比正在快速提升。
模型训练仍面临挑战：当前国产卡在模型训练领域的应用还存在诸多挑战。基于国产卡训练完成的模型规模较小，尚未见到20B以上规模的成功案例。预计在2026年前三个季度，国产卡尚无法支持百亿（100B）参数以上级别语言模型的训练。但从理论规格和潜力来看，昇腾的概率最高。

温馨提示：内容源于第三方以及公开平台，仅供用户参考，恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理（微信：_LYSD_）。