
1、GPT5与Claude的coding能力对比
复杂软件开发初始与迭代能力:以开发Word软件为例,在复杂软件开发的初始与迭代能力方面,Claude和GPT5的初始版本均存在功能缺陷。Claude初始版本点击编辑、插入、格式等操作无响应;GPT5初始版本界面简陋,运行报错需重编代码。迭代修改时,Claude接收错误反馈后可快速完善功能,修改后能实现选中、编辑、复制粘贴、插入表格等操作;GPT5修改后仍有运行问题。Claude网页端日活约500万,OpenAI日活约4.7亿。整体而言,Claude初始版本略优,迭代体系更成熟。
不同类型软件开发表现:不同类型软件的开发表现有差异。开发抖音类产品,Claude初始版本滑动无视频,修改后功能完善但素材弱;GPT5素材丰富,但修改后运行不稳定。打车软件开发,Claude输入“北京国贸”地址失败,距离计算误差1.3公里;GPT5调用OpenStreetMap精准定位(如北京首都机场、金融街购物中心),模拟叫车流程流畅。外卖平台开发,Claude流程缺失付款环节;GPT5业务流程理解深,素材丰富,可模拟全流程。
coding能力综合结论:综合来看,Claude在代码框架(如Word、抖音)和复杂程序迭代能力上领先;GPT5优势在于素材调用(图像、业务流程)和用户覆盖,其日活约4.7亿,Claude网页端日活约500万。GPT5追赶Claude,但未突破行业技术上限,凭借庞大用户基数普及了现有coding能力,推高了算力需求。
2、GPT5多模态能力测评
多模态能力表现对比:在多模态能力表现上,O3与GPT5差异显著。O3能结合兴业银行、石狮子等图像信息,准确定位福建福州的中山大厦;而GPT5仅识别为‘中山大厦,疑似有中国银行’,定位能力不足。人数计数方面,O3曾准确数出64人、16人,GPT5现无法完成64人计数,原本能数出的16人也无法准确识别。此外,谷歌Gemini也出现性能降质,原能准确数出的16人,现仅能数出15 - 16人。
多模态能力降质原因:GPT5多模态能力降质或因算力限制,其用户量大,分配的算力下降致性能降低。价格并非核心指标,市场定价能反映能力差异:GPT5为240,Claude 4为900积分,Claude 2.5为300积分。原计划的多模态与O系列融合未成功,该计划想通过O系列多做数学题、多模态多读图来提高准确率,但此路径未走通,多模态能力未达预期提升。
3、GPT5行业影响总结
技术与行业角色定位:从行业角色看,OpenAI自身进步大,但未成为领跑者,而是跟随者,未超行业第一。其核心价值在于普及优质模型能力推动行业发展。原本Claude模型能力出色但认知度低,OpenAI将其九成能力普及,扩大了优质模型认知度。行业趋势上,技术由Claude(coding领域)、谷歌(多模态领域)领跑;作为最大C端平台的GPT5,补齐能力后加速了行业普及。整体看,行业仍在加速发展,OpenAI的作用更多在普及而非技术突破。
温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议可与平台联系处理。