GPT - 5不是技术新范式,是OpenAI加速产品化的战略拐点

日期:2025-08-18 20:23:35 / 人气:17



评价OpenAI及GPT - 5,不同的视角会得出不同的结论,而这背后反映的是OpenAI从研究实验室公司向产品平台公司的转变。

不同视角下的GPT - 5

作为大众产品公司

如果把OpenAI视为已成功破圈、拥有10亿MAU的大众产品公司,GPT - 5是ChatGPT产品的一次重要升级。Routing能力的加入首次梳理统一了ChatGPT的产品线,是UX交互的重要革新。如同苹果只推一款iPhone产品线,短期内用户可能要适应GPT - 5的优缺点,但长期来看更易占领用户心智。

GPT - 5强调实用性和生产力,标志着ChatGPT产品从“朋友”迈向“助手”。其Vibe coding能力大幅提升,reasoning model更可靠、高效,引导着AI推理的算力需求增加。若推动普通用户和非技术企业向reasoning model + vibe coding迁移,将出现更多高token cost的推理任务。

作为追逐AGI技术范式的实验室

若仍将OpenAI看作“追逐AGI技术范式的实验室”,此次发布未见明确范式升级,也未解锁更高经济价值的新任务类型。Router未内化到同一个模型中,进度低于预期,因为模块化系统的智能程度不如端到端模型。对SOTA模型进行评估需要长时间、多维度、高频交互,未来初创公司可能基于GPT - 5降本、解锁新场景,不过这需要时间和规模化验证。

OpenAI的蜕变与评价视角

ChatGPT是To C最好的智能产品品牌,OpenAI正从research lab公司转变为产品平台公司。近半年,ChatGPT增速加快、用户使用习惯泛化、使用粘性增加,开始真正破圈走向大众,有了下一个Google的影子。因此,从OpenAI作为产品公司的视角评价GPT - 5更为合适。

GPT - 5:精通现有场景的Everything Model,但非次世代Agentic Model

能力提升

经过测试,GPT - 5在多数场景下任务完成度有所提升,解决了许多现实用例的卡点。其Vibe coding提升幅度大,性价比高,能平替大量基础任务;reasoning的效率与效果较o3明显提升,长上下文/工具使用更稳;API支持自定义工具,能定义高灵活度的tool - use工具集。

明显短板

Agentic能力体感无明显进步,Claude Code类agentic coding任务不如Claude 4,Deep Research表现略有下降。GPT - 4o式有“人味”和情感的对话明显减弱,指令跟随不如Claude,在复杂指令中部分要求易被忽略。这可能与routing system的加入、hallucanation的降低以及coding数据比例的增加有关。

GPT - 5是Router驱动的系统

Router的作用与优势

Router能按用户问题的复杂度与prompt信号,动态选择不同模型的智力水平和思考深度,用户可通过提示让router用更深度的思考。Router本身是小模型,利用历史用户行为数据进行训练,随着用户数据积累,其模型选择能力会快速优化。

未来ChatGPT计划将Router合入同一个模型,目前进度低于预期,因为端到端模型比级联模型更智能。Routing系统与用户抱怨的对话体验差相关性较高,对于陪伴型用户,风格可能不统一;对于效率型用户,复杂问题若未被路由到reasoning model,易出现幻觉。但从商业影响看,类似苹果只做一款产品,有助于成本优化和占领用户心智,比Google Gemini的多产品线并存更好。

商业策略

伴随着Anthropic API收入超过OpenAI的消息,GPT - 5下场打价格战,用性价比挑战Claude 4的高端模型定位。旗舰模型价格与Gemini 2.5 Pro持平,是Sonnet 4的一半、Opus 4的十分之一,比4o还便宜;平价模型比Gemini 2.5 Flash更便宜。

GPT - 5更适合做Vibe Coding

优势与特点

2024年6月Claude 3.5 Sonnet发布以来,Vibe Coding成为AI能力应用的主航道,OpenAI终于追上。GPT - 5的coding能力较前代模型提升大,适合做Pair Programmer,在IDE中配合进行迭代式开发,Debug体验不错。但它不够适合Agentic Coding,对比Claude Code,写代码更谨慎,对长代码/长时间执行的任务不够放得开。

应用潜力

GPT - 5完成的编程任务相对无趣,需要用户进一步交互和协同修改,但在满足泛大众开发者(citizen developer)的vibe coding需求方面有潜力。基于ChatGPT 10亿月活的用户体量,有机会把vibe coding需求推到新高度,甚至基于coding + 用户泛化做生成式软件平台,成为新的AI workspace入口。

Reasoning能力的进步与产品化

使用率提升

普通用户的reasoning model使用率从不到1%提升到7%,plus用户从7%提升到24%,传统企业用户使用最多的也是4o模型,reasoning model的扩散空间大。这既得益于routing能力带来的渗透率增加,也在于其自身的重要进步。

重要进步

 • 幻觉优化:早期o3存在RL reward hacking问题,导致“谎称任务完成/对不确定答案过度自信”,GPT - 5大幅缓解了这一点,在CharXiv多模态基准中,移除图片后,o3“自信回答”不存在图片问题的情况占86.7%,而GPT - 5仅占9%。

 • 推理效率:推理效率更高,在优于o3的同时,token成本下降了50% - 80%。API中设置了参数支持low / medium / high三档推理强度,开发者可选择看到模型thinking trace。

 • Tool use:GPT - 5优化了tool use能力,不满足于窄工具,偏好开放式、可组合、以自然语言为输入的工具,能“1 + 1 > 2”。它支持更自由的调用接口,成为free - form function calling,不再强依赖严格JSON schema + 精确槽位填充。还具备Parallel tool calling功能,能判断任务执行的并行和串行顺序,未来有望解锁更长的任务链。这一设计思路接近Claude Code,是不错的探索方向,期待GPT - 5后续有更多亮点。

总体而言,GPT - 5在现有任务上是实用、优秀的everything model,OpenAI的产品化战略在其中体现明显。但要保持领先,Agentic能力不可或缺,期待GPT - 5后续演进有更多此类亮点。

作者:蓝狮娱乐




现在致电 5243865 OR 查看更多联系方式 →

蓝狮娱乐 版权所有