完了!我要背弃Opus4.7叛逃到GPT5.5+Codex了

这几天一直在测国产模型,GPT5.5 都没怎么玩!

抽空玩了下 Codex + GPT5.5 + Browser Use 做开发太香了!

最重要的一点是 GPT5.5 好像不那么油腻,爱废话了

感觉就像变了一个人!

我们先来看一下网页版。

我提了一个问题:

Claude Code 是什么?可以吃么?

这是新版 Auto:

这是新版 5.5 Thinking:

首先两种模式,黑话都少了很多,说话正常了很多!

另外 GPT5.5 thinking 这种模式,明显更加简洁,表情包也少了很多。

再看一个例子。

Claude Code 的 recap 是什么功能?

新版 Auto 模式:

GPT5.5 thinking 模式:

首先两种模式下,都没有了“一句话总结,结论先行”这种表述了,而是变成了“一句话:”,从字数上看就简洁了很多。

主要是没有了那种把你当弱智的感觉。

另外 5.5 thinking 明显简短了很多,表情包几乎消失不见了。

而且那种疯狂叠括号和破折号的问题也没有了。

完了,GPT 你变了,变得让我好陌生!

你无法稳稳的接住我了!

然后再来看一下写代码。

我让他帮我改了一个小需求:

这个需求主要是一个修改需求。

我的 CodingPlan 测试平台,添加了一个可以设置思考能力的选项。但是思考预算的设置部分有点小 bug,所以我让它帮我优化一下。

它查找了相关的资料,并帮我做了修改。大概花了 7 分 29 秒!

改得挺好的:

- platform-form.tsx:去掉 step={1024},改为 step={1},所以 8000 不再被浏览器原生校验拦截。
- platform-form.tsx:新增常用预算下拉:1024 / 2048 / 4096 / 8000 / 12000 / 16000 / 32000,同时保留自定义输入。
- route.ts:新增平台时也保存 thinkingConfig,避免新增配置丢失。
- anthropic-client.ts:手动思考预算较大时,自动抬高默认 max_tokens,避免 Anthropic 要求 budget_tokens < max_tokens 导致请求失败。

通过修改总结里可以看到,它首先去掉了原先的步进限制。

然后新增了 6 个档位,同时保留了自定义输入框。

同时还帮我更新了“新增功能”,避免新增的时候配置丢失,很全面。

另外还考虑到了 max_tokens 要大于 budget_tokens 的问题,做了一些优化处理。

功能不大,完成的挺好。

但是重点不是在这里,重点是它自动做了功能验证。

自动验证并不是在代码上验证,而是直接调用浏览器,直接操控鼠标进行验证。这个就太牛逼了!

你可以看到鼠标自己动,自己添加平台,自己切换思考模式,自己验证修改功能。

这个 Browser Use 功能非常强大,也非常实用。

有了这个东西,前端的开发和测试就可以完成闭环了!

除了浏览器的使用之外,Codex 的开发相关功能也非常齐全。

可以一键运行项目,可以用Git管理代码版本,可以打开终端,可以查看文件目录,可以审查修改代码。

它的 Computer Use 也很强,即便是在 Windows 上,各种软件的安装配置都非常丝滑。

比如你没有开发环境,它会自动帮你安装。如果涉及到大的变动,会先询问你,你只要说继续,它就帮你搞定。

所以综合来看,Codex + GPT5.5 + 电脑和浏览器操作,已经是一个不错的开发工具了!

我以前最喜欢的就是 Claude Code + Chrome 插件,现在的 Codex 对电脑和浏览器的操控好像比 Claude Code 这个组合还要丝滑。

另外GPT还有两个特点,一个是不用担心封号,一个是配额要比 Opus 多

我目前在尝试:硬核的,需要开疆扩土的任务让 Opus 4.7 上,一旦攻克难题之后,其他问题就交给 Codex 来接手。

我当然不会真的抛弃 Opus,它还是我手里最猛的一员猛将。

 

小尾巴==========================
公众号:托尼不是塔克
交流群
知识星球
==============================

 



发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注