路演时代

华创计算机 DeepSeek 与海外大模型展望

1、DeepSeek-V4核心技术特性解读

核心性能突破：DeepSeek-V4间隔上一代V3.2版本超1年推出，是具备跨时代意义的大模型，核心性能指标已逼近国际一线水平。其上下文窗口达1兆，可直接处理百万字书籍、数十万行代码库、成百上千页律师合同等长文档，无需分批次上传，百万token级上下文需求可直接满足。同时输出成本仅为云端的1/50，让百万token上下文能力具备高可用性。技术层面搭载稀疏推理运算与混合专家学习架构，较上一代V3.2有明显升级，在长链任务、多智能体场景下适配优势显著，对智能体能力的支持大幅提升。

训练技术创新：DeepSeek-V4针对万亿参数MoE结构的训练稳定性推出优化方案，包含全占式路由、夹逼策略等技术，可大幅降低大模型训练回滚次数，避免单次回滚耗费数周甚至数月的时间成本。相关技术已完全开源，可为国内其他大模型厂商提供经验参考。不过目前仅验证了技术有效性，尚未明确底层作用机理，也未确认100%适用场景，应用过程中仍需谨慎。

国产化适配进展：自媒体所称DeepSeek-V4训练全面采用华为芯片的说法不实，从技术文档来看，DeepSeek-V4支持MXLP4量化，该技术仅英伟达Blackwell系列显卡具备，因此预训练阶段主力采用英伟达Blackwell B200级显卡，未完全摆脱英伟达芯片、全用华为卡训练，不排除采用混合卡训练技术，需理性看待其对国产大卡的训练适配能力。推理端目前已完全支持华为910/950芯片，华为方面表示2026年下半年950产能将释放，叠加DeepSeek-V4正式版预计同期推出，后续其在国产化板卡上的适用性将大幅提升，国内厂商将纷纷跟进，此外寒武纪芯片也已完成与DeepSeek-V4的前期联调适配。DeepSeek-V4是国内首个可在国产化芯片上完全运行、性能逼近国际一线水平的大模型，当前国内超算中心、云厂商算力中心的国产化板卡占比达20%-40%，其能力提升将有效释放这部分存量国产算力的价值。

现有技术局限性：DeepSeek-V4目前存在两方面技术局限性：一是架构层面为追求训练效率、避免训练回滚，采用了大量经验性临时补丁修补漏洞，未明确补丁生效的底层逻辑，包括已验证有效的全占式路由等技术也尚未明确作用机理，技术可解释性较差，官方表示下一代版本将对架构进行精简优化。二是当前版本为单模态模型，暂不支持图像、音频、视频等多模态内容的理解与生成，不具备类似Gemini的多模态处理能力。

2、DeepSeek-V4商用前景与国产化挑战

用户实测反馈：当前DeepSeek-V4仍为预览版，用户尝鲜过程中发现三类核心问题：
a. 硬件门槛较高，两张A100/H200显卡无法正常运行，消费级显卡运行易出现内存溢出错误，仅适配数据中心或云中心级推理环境，无法像小体量模型在终端或消费级显卡上运行；
b. 长任务处理稳定性不足，与针对长任务、多智能体执行优化的Kimi2.6相比，DeepSeek-V4长任务结果摇摆幅度大于Kimi2.6，同一任务多次运行结果偏差明显；
c. 回复中立性不足存在安全风险，模型有明显讨好型人格特征，易受强势prompt引导输出不当内容，在事实陈述要求较高的场景下存在应用风险。目前预览版表现仍待大规模使用后，进一步验证其真实任务处理效果。

商用适配价值：DeepSeek-V4官方自测性能略低于Gemini3.1，较海外头部模型存在3-6个月半代代差，这一定位反而更适配生产环境用户实际需求。生产环境模型选型更看重确定性、经济性与稳定性的平衡，而非单纯追求最高性能，当前主流生产环境多采用Gemini2.5模型：一是其已知缺陷便于提前规避应用风险；二是新模型推出后Gemini2.5价格大幅下调，token使用成本对用户更友好；三是其速率与稳定性优于Gemini3.2等新版本，无需占用高端显卡资源保障推理服务。DeepSeek-V4的能力定位与现有生产环境的模型适配要求高度匹配，可实现平滑切换，无需额外适配新特性的成本，用户接受度反而优于性能远超现有版本的模型，更具商用落地基础。

国产化训练挑战：DeepSeek-V4的国产化适配广受关注，当前国产化训练仍面临多重挑战：首先是适配难度差异显著，大模型训练适配工作量是推理的5-10倍，并非简单修改算子或硬件结构适配即可完成。当前华为910卡已可支持DeepSeek-V4推理，但训练适配仍需较长周期，华为2027年将推出950/960/970系列芯片，若PyTorch适配完善，未来国产卡训练流畅度有望提升。其次是外部政策倒逼国产化训练紧迫性提升，美国拟堵死新马地区海外算力通道，此前国内企业可通过该区域不受美国监管的数据中心绕道获取高端算力训练，若通道被切断将完全依赖国产算力，国产化训练任务落地时间早于预期，目前国内GPU厂商尚未形成统一标准与公开协议规范，仍需头部企业牵头推动生态建设。

3、海外大模型发展格局与技术趋势

Anthropic核心发展策略：作为风格独树一帜的大模型厂商，Anthropic定位为全球定价最高的大模型厂商，核心主打安全合规优势，其推出的AI宪法是所有模型训练、任务执行的核心准则，因此Claude系列模型回答中立性、客观性突出，遇到未核实信息会明确拒绝回复，不会随意猜测内容，从Claude 3.5到3.7版本，模型的人格中立性提升感知十分明显。为规避单一供应链绑定风险，Anthropic硬件采购采取多厂商绑定策略：推理侧大规模向谷歌TPU迁移，采购金额达100亿美元，该订单甚至导致谷歌云TPU资源紧张，内部业务事业部使用受到影响；训练侧与亚马逊深度绑定，算力采购金额达40-80亿美元。此外，Anthropic去年斥资数十亿美元从科研机构购入独有的苹果评估数据集，用于修正模型回答的准确性与中立性，预计迭代到4.0、4.5版本时，模型在严肃任务上的可信度将进一步提升。

AI for Code范式转移：去年Anthropic旗下Claude Code产品表现亮眼，月营收从10亿美元增长至60-80亿美元，涨幅显著，带动硅谷全行业布局AI for Code领域，进而推动核心范式转移。此前行业普遍将AI for Code与AI for Science、AI for Math视为并行的独立能力，随着Claude Code等产品的推出，AI for Code已成为大模型的基础核心能力，可用于解决其他领域的一系列问题，该趋势甚至倒逼谷歌要求DeepMind今年在编程能力上超过Anthropic。本次范式转移将带来三方面影响：a.软件接口形态变革，过去模拟人类操作GUI的路径被验证行不通，模型天生适配CLI，当前各应用纷纷开放CLI接口与技能生态；b.token消耗量大幅增长，低价token供给的重要性持续凸显；c.软件生态从封闭向开放转型，厂商未来需考虑是否开放自身能力接口与大模型深度融合，而非死守封闭生态。

OpenAI与Gemini差异化路径：OpenAI与谷歌Gemini采取差异化发展路径。OpenAI方面，GPT5.5相对GPT5.4的代际能力提升有限，尽管官方基准测试表现更好，但行业对快速迭代的benchmark敏感度较低，本次更新更多是面向资方的品牌展示行为，未发生训练范式的核心变革。实际应用中老版本模型更受青睐，比如GPT-4.5因200万的上下文窗口更小，任务反馈速度更快，部分机构内部以老版本模型作为主力。Gemini方面，Gemini 3.1已进入新代际，具备成熟的多模态能力，竞争策略与其他厂商差异明显：依托谷歌海量产品生态，目标部署场景均为十亿级用户量级产品，已接入Apple Intelligence覆盖近30亿台iPhone设备，同时可依托Google Workspace、YouTube等自有产品反哺模型能力，无需大规模拓展To C市场，竞争维度与其他头部大模型厂商不同。

4、国内大模型厂商差异化路径对比

智谱发展路径：智谱核心优势在于蒸馏体系完备，工程化经验与框架积累深厚，OPPO 3.5推出后，GLM 5.1的coding能力实现大幅跃升。其商业化策略指向明确，Coding场景使用Coding Plan可享2-3折低价优惠，若将Coding Plan用于非Coding场景，定价将升至用户难以承受的水平，甚至可能被中断API访问。该策略核心意图是瞄准用户私有库：当前公开代码库仅能解决10%的真实场景问题，剩余90%的专业领域需求存储于用户私有库中，智谱希望通过低价策略吸引用户使用Coding服务，进而获取私有库数据训练模型，强化专业领域模型能力。

Kimi发展路径：Kimi具备一定自研能力，核心优势在于对中国用户需求的深度适配，其推出的智能体Mesh、长任务处理能力均针对国内丰富应用生态优化。当前Kimi已成为云厂商的算力分发入口，改变了传统云服务商单纯售卖云主机、VPC的模式，通过Kimi大模型引流用户，再依托云托管能力售卖云服务资源，实现大模型与云业务联动。商业化进展方面，Kimi Claude月订阅费为199元，2026年2月营收大幅增长，合作云厂商也获得可观分成。

DeepSeek战略价值：DeepSeek选择全自研的高难度技术路线，率先实现MoE架构落地应用。MoE技术原理虽早已在谷歌论文中提出，但硅谷厂商未率先落地，DeepSeek的技术突破为行业趟通了高难度技术路线，后续谷歌推出的Gemini 3.1也显现出MoE架构相关特征，行业影响力显著。战略定位方面，2026年4月披露的最新融资资方为腾讯、阿里，承担着国产大模型自主可控的战略使命，是中美科技竞争加剧背景下国产大模型技术自主的核心力量。此前行业普遍认为幻方量化盈利能力较强，因此DeepSeek早期商业化动力不足，布局较弱，无专门商业化团队与PR投入，定价较低，人员招聘以算法工程师为主，未大规模扩招销售、市场类岗位，商业化模式较轻。产品端核心价值在于适配高合规要求场景，支持从物理主机开始搭建可信网络，可与企业现有IT合规、审计体系融合，为医药等无法使用公有云的高合规行业提供了大模型落地的可行路径，战略意义远高于商业化性价比。

美国管制政策影响：美国针对中国大模型训练、蒸馏的管制政策仅能从道德层面谴责，无法通过技术手段实现完全封禁。当前中国企业普遍通过东南亚等地区中转算力，上述区域80%-90%的算力已被中国企业租用，用于模型训练、推理等相关需求。此外大模型厂商之间互相蒸馏是行业公开秘密，管制政策无法从根本上限制中国大模型的技术迭代进程。

5、大模型行业落地前景分析

垂类领域落地逻辑：Coding落地具备标准化工程范式，流程涵盖架构分解、概要设计、详细设计、单元测试等十余步骤，Cloud Code通过强约束的管控工程体系保障各环节准确性，避免单环节1%的误差累加导致最终结果完全错误。企业私有Know-how壁垒较高，代码仅占软件工程总工作量的15%-17%，其余80%以上为数据、工艺、生产流程等非代码内容，仅获取代码无法复制核心能力，例如核心BMS仿真代码背后涉及材料学、生产工艺优化等隐性Know-how，外行拿到代码也无法使用，仅直接竞争对手具备参考价值，核心数据泄露风险较低。

AI生产力提升阶段评估：当前AI在工业场景已实现单点突破，例如药品标签检测场景中，仅需3-5人即可完成面向100多个国家的100余种语言标签校验，单点效率提升显著，但对全产线的拉动作用有限，即使单点效率提升500%，全产线整体效率提升可能仅为2%甚至更低。目前AI对人类整体生产力的提升程度不足10%，处于极早期爬坡阶段。通过coding改造企业生产流程的行业共识自2025年6月逐步形成，当前仅Gmail、Slack等单一功能软件完成大模型适配，主流办公套件尚未公开支持相关接口，CLI模式下的身份验证、安全配套仍不完善，预计1-2年后产业渗透节奏将明显加快，待适配率达到临界点后进入快速普及阶段。

蓝领工作替代前景：AI对蓝领工作的替代是确定性长期趋势，类似汽车司机替代马夫、计算机替代打字员的变革，一旦落地完成便不可逆转，对应岗位将永久消失。但工业场景落地难度较高，生产环节对操作精度、可靠性要求极高，当前机械臂等自动化设备的操作精度与实际生产需求仍存在数个数量级差距，需生产工艺、流程同步优化适配，整体落地周期长达10-20年。工业领域对AI技术的接受节奏比纯软件、AI行业晚3-5年，核心原因是工业场景容错率极低，技术需经过数千万次验证确保零误差才能落地，例如农机智能化改造的周期通常以十年为单位。

6、AI算力硬件需求观点辨析

CPU短缺观点反驳：针对英特尔提出的AI进入AI Agent阶段后GPU性能过剩、CPU成为产能瓶颈的观点，这一逻辑牵强，本质是英特尔为自身向好业绩寻找的理由。反驳逻辑如下：a. 代码生成属于大模型推理环节，运行在GPU上，而代码解释执行在CPU上是行业长期惯例，自七十年代以来未变，不存在新增CPU需求驱动逻辑；b. 代码生成量不会出现量级跃迁，固定场景下人工编写约10万行的代码，用Codex生成也仅约12万行，不会无意义膨胀；c. 代码运行受硬件承载能力明确约束，所有代码都需在给定的CPU主频、容量等参数限制下开发，不存在因AI生成代码导致的CPU独立短缺情况。

算力硬件配比逻辑：CPU需求增长与GPU扩容存在绑定关系，而非独立行业应用推动。GPU无法独立工作，数据中心GPU数量增加、性能提升必然带动配套CPU需求增长，GPU越高端，对高端CPU的适配需求越高。但GPU与CPU的配比不会大幅提升，不会出现从1:8降至1:4乃至1:2的情况。实际配置中，1块刀片服务器挂2块GPU板卡通常需配4颗CPU适配；类比来看，GPU相当于车辆的轮子，CPU相当于方向盘，不会因轮子数量增加大幅提升方向盘数量，且用户不会因软件需求大规模替换现有硬件，因此CPU需求增长仅是GPU扩容的附带结果。

7、AI对软件产业与竞争格局的影响

企业软件替代影响：AI对不同类型企业软件的冲击程度存在显著分化：a. 受冲击较大的品类包括中小SaaS软件、共享库/插件类工具、设计类软件：2024年成立的硅谷初创企业推出集成大模型能力的Customer Success软件，可实现多系统信息整合，原本需订阅4个SaaS软件的需求可被1个该类产品替代，部分传统巨头软件需求被挤压；Photoshop滤镜这类依附平台的插件工具，用户可直接通过Gemini生成所需功能，无需购买下载相关共享库；设计类是受颠覆最快的领域，多数企业无需专业级设计效果，非高频、低连续性的普通宣传片制作、前端UX设计等需求可被AI设计工具满足，Claude Design等产品推出后，Figma等纯设计软件相关企业股价下跌16%。b. 头部企业软件替代难度大：Salesforce、SAP、Slack、ServiceNow等产品内部沉淀大量行业know-how，且与其他巨头系统集成绑定程度深，短期难以替换。未来软件行业将呈高度分化格局，中小独立软件厂商淘汰风险较高，行业巨头集中度将持续提升，甚至可能走向生态封闭化。

国内大模型路径对比：国内大厂背景大模型与独立大模型厂商的发展路径、市场定位差异明显，无直接竞争，呈互补格局：a. 大厂模型走生态落地路线：以字节豆包为代表的大厂模型依托飞书、短视频等自有生态落地，路径与谷歌类似，优先覆盖自家产品用户再向外拓展，当前抖音平台已可生成1分钟左右的AI短剧，人物声音、情节匹配度已达较好水平。b. 独立厂商走纯技术输出路线：智谱、Kimi等独立厂商不搭建自有生态、不布局云业务，纯靠模型性能、低幻觉率等技术硬实力竞争客户，其中智谱凭借资质优势承接了大量银行、政府、企业的私有化部署订单，这类订单是面向C端的大模型厂商无法覆盖的。两类厂商客户群体差异显著，赛道无明显重叠，该格局将长期持续。此外，Minimax、智谱等头部独立大模型厂商若今年完成港股上市，将吸引大量美国传统资本布局国内大模型赛道，对全行业发展有正向示范作用。

DeepSeek-V4格局影响：DeepSeek-V4不会对国内大模型现有竞争格局产生显著冲击，核心价值在于行业技术探索：a. 格局影响有限：DeepSeek市场份额长期低于2%，曾低至1.3%，用户规模较小；从V3.2迭代至V4间隔长达15个月，更新速度、知识迭代效率偏低，且用户对原有模型的适配成本较高，更换模型并非仅修改名称即可完成，因此即使推出V4也难以实现市场份额大幅跃升，豆包、Kimi、智谱等头部厂商的领先地位不会受影响。b. 技术贡献突出：DeepSeek主打开源技术探索，公开大量技术论文与研发成果，为行业探路验证技术可行路径，对Kimi 3等后续大模型的技术演进有较大参考价值，推动国内大模型行业技术迭代。此外，当前严肃场景下用户更偏好性能与成本均衡的模型，单纯追求大上下文窗口的"量大管饱"类产品需大量人力修正幻觉，综合成本更高，这一用户偏好也进一步限制了DeepSeek-V4的市场扩张空间。

Q&A

Q：DeepSeek-V4在技术架构上有哪些主要创新和亮点？

A：DeepSeek-V4将上下文窗口扩展至100万token，显著提升处理长文档、代码库及专业合同的能力，推理成本约为Cloud的1/50。采用混合专家学习架构，在多智能体与长链任务中表现更优。技术创新包括稀疏推理运算优化、全占式路由及夹逼策略，有效减少大模型训练过程中的回滚次数，为国内大模型训练提供重要参考。

Q：DeepSeek-V4在国产化芯片适配方面进展如何？对国产AI算力生态有何影响？

A：推理阶段已完全适配华为升腾910/950芯片，华为计划下半年释放950产能，将显著提升国产化推理能力；寒武纪等厂商亦参与联调支持。训练阶段目前仍以英伟达Blackwell B200为主，完全国产化训练因工程复杂度高尚需时日。DeepSeek-V4作为首个在国产芯片上可完整运行的对标国际一线模型，为国内超算中心及云厂商沉淀的国产算力提供释放路径，具有重要生态示范意义。

Q：目前用户对DeepSeek-V4预览版的实测反馈存在哪些问题？

A：用户反馈显示：消费级显卡难以运行，需数据中心级环境；在多智能体长任务中结果摇摆性显著高于Kimi-2.6；回复风格存在讨好型人格倾向，在强势提示下可能输出不当内容，中立性不足；当前版本为单模态模型，暂不支持图像、音频等多模态理解与生成。

Q：DeepSeek-V4在生产环境部署中的适用性与定位如何？

A：官方自评能力略低于Gemini-3.1，这种代差反而利于生产环境平滑切换，避免因模型能力突变导致的适配风险。其成本效益与稳定性更契合企业对确定性、经济性的需求，尤其适合需私有化部署且受合规限制的行业。结合下半年正式版发布与华为950推理卡产能释放，国产化适用性将进一步提升。

Q：海外大模型近期有哪些关键进展与竞争分化趋势？

A：Anthropic强调AI宪法与中立性，投入数亿美元采购苹果数据集优化模型可信度，推理侧大规模迁移至谷歌TPU，训练侧与亚马逊深度绑定；OpenAI的GPT-5.5代际提升有限，更多体现为技术宣示；Gemini 3.1依托多模态能力及谷歌生态与苹果合作，切入十亿级用户场景。Cloud Code推动AI for Code成为基础能力，引发软件范式转变：CLI接口、技能开放成为新标准，token消耗与软件开放程度成为关键挑战。

Q：相较于Kimi与智谱，DeepSeek最显著的贡献点与行业启发是什么？其性价比问题是否源于国产推理卡投入不足？

A：智谱凭借完备蒸馏体系快速提升coding能力，并通过Coding Plan策略获取用户私有库数据；Kimi聚焦中国用户生态，在智能体Mesh与云算力分发上形成商业闭环。DeepSeek选择完全技术自研路径，攻克MoE等硬核技术并开源，为国产芯片适配提供关键验证。其性价比并非核心目标，核心价值在于承担国产化使命：为合规受限行业提供bare metal私有化部署方案，并推动国家算力资源有效利用。腾讯、阿里近期注资亦体现战略层面支持。

Q：美国对中国大模型的训练及蒸馏限制能否产生实质性影响？

A：技术层面无法完全封禁。行业普遍通过海外算力节点进行训练或蒸馏，属公开实践。尽管存在道德谴责与指纹追踪等手段，但无百分百封锁技术，蒸馏已成为全球行业常态，限制的实际约束力有限。

Q：在垂类领域，大模型如何解决行业Know-how壁垒？企业是否愿意开放私有数据用于模型训练？

A：Coding方案通过软件工程范式与强约束工程管理提升生成准确性。行业Know-how壁垒较高：代码仅占软件工程工作量15%以下，80%以上为非代码隐性知识。私有数据对外行价值有限，且企业可通过Terms of Service管控使用边界，风险可控，形成技术互补而非单向索取关系。

Q：以人类生产力提升为100分，当前AI在coding等领域的实际贡献占比约为多少？

A：当前整体占比不足10分，处于早期爬坡阶段。单点应用已有显著提效，但产线级整合有限。软件生态适配滞后：主流产品尚未全面支持CLI/MCP规范，仅Slack、Gmail等单一功能完成初步对接。范式转变需1–2年观察，待turning point出现后速率将加快。

Q：AI在替代蓝领工作方面的前景如何？与替代白领工作的进程差异何在？

A：替代潜力巨大但进程缓慢，参考司机替代马夫的历史路径。工业领域对AI适配比软件行业滞后3–5年，因错误后果严重需千万次验证。当前聚焦视觉引导等单点优化，需工艺与AI互相适配。一旦技术成熟将不可逆，但现阶段推进极其审慎。

Q：如何看待英特尔总裁关于AI Agent阶段CPU短缺、GPU过剩的观点？

A：该观点牵强。代码生成与执行为分离流程，生成代码量受硬件载体严格约束，不会指数级膨胀。CPU需求增长主因是GPU卡数量增加带来的配套需求，属自然附带关系，非Agent应用导致计算负载转移。英特尔作为CPU厂商的表述需结合商业背景审慎看待。

Q：AI对企业级软件的替代影响如何？企业实际态度怎样？

A：冲击显著但分化明显：中小独立软件面临AI生成插件替代风险，股价已受冲击；巨头软件因生态绑定与集成深度替换缓慢；设计类软件因非专业需求可用AI满足，颠覆速度较快。企业倾向选择均衡模型，避免量大管饱导致后期人力校验成本反升，当前更重稳妥落地而非激进替换。

Q：如何对比豆包、Qwen等大厂模型与智谱、DeepSeek、Kimi等独立模型厂商的发展路径与竞争前景？

A：大厂模型依托自有生态优先内部落地，路径类似谷歌；独立厂商专注技术输出与定制化部署，智谱凭借背景承接政府、金融私有化项目，Kimi成为云厂商算力分发入口。两者市场互补，短期无直接冲突。智谱、Minimax等上市吸引国际资本回流，对行业具示范效应。未来竞争将是生态整合与垂直技术能力的结合，独立厂商在特定场景仍具不可替代性。

Q：DeepSeek-V4对当前大模型市场竞争格局会产生何种影响？

A：市场份额长期低于2%，更新周期长，对豆包、Kimi、智谱主导的格局冲击有限。核心价值在于技术探索与开源贡献：验证MoE等硬核路径可行性，降低行业试错成本。用户因适配成本高、知识更新慢，更倾向选择均衡模型。其技术探路者角色重在推动国产化技术演进，而非直接参与商业竞争。

温馨提示：内容源于第三方以及公开平台，仅供用户参考，恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理（微信：_LYSD_）。