1、2025年大模型发展与Deepseek MHC算法影响
大模型后训练与深度推理进展:2025年大模型发展重点转向后训练与深度推理,产业界将核心放在加强COT、强化推理以提升模型聪明度,让模型思考时间更久、回答更精准、减少幻觉。Deepseek年初发布的R1模型是全球第二个深度推理模型,引领了后训练方向,推动行业沿此路径发展。2025年大模型的基模型能力未提升,最新的GPT 5.2仍采用2024年推出的GPT 4O,未更新基模型。谷歌的机密3也遵循这一思路,整个科学界和产业界均将重点放在大模型的深度推理上,通过后训练让模型更聪明。
Deepseek MHC算法及对国产卡的影响:Deepseek近期推出MHC算法论文,该算法通过精细化管理数据传输(类比交通信号机制),解决了复杂神经网络中数据乱跑、内存带宽消耗过高及训练宕机问题,仅需增加6.7%的时间损耗,即可实现模型训练的顺滑稳定,避免了大模型训练中常见的宕机重启问题。此算法对使用国产卡的企业极具价值,因国产卡卡间互联速度慢于英伟达卡,传统训练中国产卡速度较慢,但加入MHC算法后,国产卡训练虽速度慢却能持续稳定运行;而英伟达卡训练速度快但易宕机,需要频繁维修重启。MHC算法适配国产卡特点,提升了其训练稳定性,或令国产卡训练效率更具竞争力。
2、生成与理解的统一进展
生成与理解统一的实现情况:2025年大模型领域取得重要进步,但当前模型生成内容可控性不强,存在生成式幻觉及理解偏差,且理解图片、视频能力较弱,这些是2026年大模型发展的重点方向。
3、2025年国产算力芯片进步
国产算力芯片性能提升:2025年上半年推出的国产芯片(如寒武纪690、海光申算4号、华为升腾950 PR等)支持FP8数据格式(FP8是Deepseek在2025年年初推出的主流数据格式,此前国产卡均不支持,仅英伟达卡支持);国产卡结合超节点后,卡间互联速度达700-800G每秒,而英伟达H系列卡(H20或H200)的卡间互联速度为900G每秒,国产卡性能已接近H系列水平。不过,英伟达2025年将推出Ruby系列卡,技术领先国产卡两代。
国产卡的训练能力突破:国产卡达到英伟达H系列水平后,不仅可做大模型深度推理,还具备大模型训练能力;结合Deepseek的MHC机制,用国产卡做大模型训练,效果或不逊于英伟达B系列或Ruby系列卡。2025年国产卡在训练与推理能力上迎来长足进步。
4、具身本体与世界模型发展
具身本体能力提升:2025年具身本体的散热、功耗、持续性、可靠性有较大进步,但构型稳定性仍存不足。人形机器人诞生仅一两年,AI大模型自2023年初OpenAI推出GPT 4后开始大规模发展,这两年的发展速度远快于互联网及移动互联网。
世界模型的探索与瓶颈:世界模型是将AI虚拟模型能力与物理世界结合,让AI理解物理规律的模型,2025年刚提出,国内外团队正持续发展,但尚处起步阶段。目前机器人落地侧重结构化场景,非结构化及泛化场景落地需时。世界模型发展核心瓶颈为数据短缺,与无人驾驶相比,机器人采集数据困难且对操作员要求高。2026年产业界将探索数据解决新方法,世界模型与机器人结合是2026年人工智能重要发展方向和看点。
5、2025年AI应用现状与展望
2025年AI应用的发展现状:2025年AI应用整体低于预期,大厂和创业公司已产生收入,但未在上市公司身上体现明显变化,美股和A股的AI应用股票2025年机会不多,机构投资者难以把握;美股2025年涨的是算力,应用类股票没怎么涨,A股有波段性机会但同样难把握。分析原因,AI应用仍偏表层,集中在写代码、文生图、文生视频、做简单PPT等类似Manas的事情,未深层次结合企业或个人的数字化工具。举例来看,OpenAI 2025年已实现100多亿美元的AR,2026年预期300亿美元,说明泛泛的模糊场景已落地并产生收入,但精准场景因模型幻觉率仍无法应用——当前模型幻觉率虽降至10%,但仍无法满足企业或个人对精细化、精确场景的需求,而广大场景恰恰需要精准化,泛泛场景已完成落地。应用类公司可通过工程化手段降低幻觉率和实现精准化,大模型公司仅负责做好大模型,应用类公司需承担将模型与场景结合的工程化工作,如MindSpore在工程化能力上有开创性技术,Meta愿意花20亿美元收购有其道理。
AI应用的未来展望:AI应用的突破需要模型能力提升与深度结合,当前时间与能力均未成熟。2026年AI应用的发展需“走一步看一步”,核心催化剂为模型能力的提升,比如Deepseek计划将MHC算法应用到新模型中,其新模型值得期待;Deepseek的工程师团队研发的算法并非依赖算力或数据,而是靠研发人员的智慧,其新模型的推出十分重要。目前很难预测2026年AI应用会有怎样的进步,需要看新模型推出后带来的应用变化,具体时间需具体分析,需“走一步看一步”。同时,2025年大模型全年工作集中在后训练和加强推理,基模型能力未提升,2026年可能提升;生成和理解完成统一但仍不完善,存在生成式幻想、可控性差、图片视频理解能力差等问题;国产AI算力芯片基本达到英伟达H系列水平,支持FP8数据格式,可用于训练和深度推理,国产大模型公司用国产卡训练效果不错;世界模型和具身本体能力2025年有较大提升,李飞飞等提出往世界模型产业发展,期待2026年有更大进步以推动机器人大脑泛化能力提升。
温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)。