最佳work模型sonnet5来了,直接就能用!
你们的 Anthropic 账号还好么?Claude 新模型 Sonnet 5 来了! 我大概测了一下,有点东西。

这几天大家都说 Opus 4.8 疯狂降智,原来是为了它!
我快速看了它们的官方博客,快速总结一下:Sonnet 主打一个“物美”价廉,是最适合日常工作的模型!
先说物美!
这一波更新对 Sonnet 4.6 的用户来说绝对是一个巨大的好消息!

Sonnet 5 在推理、工具使用、编码和知识工作方面比 Sonnet 4.6 有显著改进,各方面参数都比 Sonnet 4.6 有巨大的提升,已经非常接近 Opus 4.8 了。
也就是说,Sonnet 是个各种工作都能干的模型,包括编程这一类工作,智能体编程能力真的是提升巨大!
知识工作方面也是提升巨大,甚至超过了 Opus 4.8!
除了这些基准指标之外,还有标准的 100 万上下文!
它的思考模式也从原来的扩展改为了自适应:
Adaptive thinking replaces extended thinking. It’s on by default in Claude Code and the API. Start at medium effort, and bump to high for long agentic runs or memory-heavy work. Most coding and tool use won’t need more than that.
这些变化其实都是为更加复杂的长任务而准备的。根据他们的测试,Sonnet 5 和 Sonnet 4.6 最大的差别就是“能和不能的差别”。
很多任务 Sonnet 4.6 直接摆烂,但是 Sonnet 5 可以很好地完成!
再说价廉
物美很重要,价廉就更好了。
说 Claude 便宜,骗鬼呢?确实,相对国产模型,不可能便宜。但是相比同样的国外模型,确实很便宜了。
| 模型 | 输入 | 缓存输入 | 输出 | 备注 |
|---|---|---|---|---|
| Claude Sonnet 5 | $2 | $0.20 | $10 | 2026 年 8 月 31 日前优惠价 |
| Claude Sonnet 5 | $3 | $0.30 | $15 | 2026 年 9 月 1 日起 |
| Claude Opus 4.8 | $5 | $0.50 | $25 | Anthropic 高端旗舰档 |
| GPT-5.5 | $5 | $0.50 | $30 | 短上下文价格 |
| GPT-5.5 长上下文 | $10 | $1.00 | $45 | OpenAI 单独长上下文档 |
| Gemini 3.1 Pro Preview ≤200k | $2 | $0.20 | $12 | 标准档 |
| Gemini 3.1 Pro Preview >200k | $4 | $0.40 | $18 | 超过 200k 输入后涨价 |
从上面的表格可以看到,Opus 4.8 的价格是输入 $5、输出 $25,Sonnet 5 的价格是输入 $3、输出 $15,然后在特惠期间只要 $2 和 $10。
这一档是国外顶级模型中最便宜的存在了!
虽然相比国产模型还是贵,但是拥有接近 Opus 4.8 的能力,价格却能打六折,这么看性价比就很高了。
所有人都能用
Fable 5 疯狂作妖,一会儿上,一会儿封,一会儿要认证。实在是让人太难了。Sonnet 5 在这方面就好多了。

直接全平台推送,手机、电脑、网页端立马可以用上。无论你是 Pro 用户还是免费用户,也能立马用上!
当然前提是你有账号,你的账号还活着~~!
做个小测试
我手里有非常多的测试项目,但是鉴于时间和 token 量的考虑,我就做一个最新的题目“天文机械表”!
这个题目是有点难度的,是多方面能力的考验。
最近测了一批模型,国产模型全躺,没有一个可以完成所有功能。之前只有 Opus 4.8 几乎满分。
完整的题目如下:
用单个 HTML 文件实现一只机械腕表风格的天文时钟,纯原生实现,不许使用任何库、框架或 CDN。要求:
1. 主表盘读取本地系统时间,秒针平滑扫秒,使用 requestAnimationFrame 驱动,且长时间运行不得累积漂移;切到其他标签页再切回来时,指针必须立即校准到正确时间。
2. 包含一个月相小表盘,根据当前日期计算并显示月相连续变化,公式需要自行实现,精度要求误差控制在 1 天内。
3. 包含一个可用的计时码表,通过子表盘指针显示,支持开始、暂停、继续、归零与计圈(lap),按钮在任意顺序点击都不能出现状态错误。
4. 日期窗显示当前日期,正确处理大小月与闰年。
5. 包含昼夜 / 日出日落指示,用户可在三到四个预设城市之间切换,并根据经纬度现场计算当地日出日落时刻。
6. 页面需要响应式,并尊重 prefers-reduced-motion:开启时秒针改为跳秒并关闭装饰动画;同时为各表盘补充 ARIA 标注。
7. 整体视觉要像一只真实的高级腕表,而不是普通练习作业。
只输出最终代码,不要解释。
测试说明:
这是一个面向前沿模型的**长规格前端综合题**。与普通模拟时钟不同,它故意把数学推导、动画工程、状态机正确性、无障碍适配与高级审美堆叠在同一题中,观察模型是否会在实现过程中静默漏需求。
题目的核心目标不是“做一个能转的表盘”,而是要求模型在**闭卷推导**与**高约束实现**之间保持稳定。月相算法、日出日落计算、后台切回后的时间校准,以及计时码表的开始 / 暂停 / 继续 / 归零 / 计圈边界行为,都是高频失分点。
工程要求:主表盘必须使用 **requestAnimationFrame** 驱动平滑扫秒,不能依赖会累积漂移的定时器;切换后台标签页后,返回前台时指针必须立即与系统时间重新对齐。
设计要求:页面必须保持单文件、纯原生、响应式,同时尊重 **prefers-reduced-motion**,为关键表盘与控件补齐 ARIA 标注,并在整体视觉上呈现出真实机械天文腕表的精致感,而不是普通练习作业。
我直接用 Claude 桌面版的 Chat 功能进行测试:

思考强度是中等(Medium):

它上面还有三个大哥:High、Extra、Max!
结果出来了:

好像又是全对!
时钟显示正常,地区切换联动正常,秒表启动、停止、重置、lap 全部正常,月相应该也是正常的。

当前基本上属于整个月亮被点亮的状态!十五的月亮十六圆,现在刚十七。
Claude 诚不欺我,Sonnet 5 在这个题目上的结果和 Opus 4.8 几乎一致!
而且我这次只开了中档,当时 Opus 4.8 跑的是高档。事实证明,这个任务对应 Claude 最新系列的模型只要中档就够了。但是除了它家的模型之外,几乎都无法把这个题目全部做对。
所有的测试结果我都放在了 Jarvis Uni 的 TOPAI 板块中,大家可以进行非常直观的对比。
更多测试稍后奉上!
Sonnet 5 的思维能力这么强,这种复杂编程都不在话下,那么作为日常工作绝对是游刃有余了。再配合它们家的 Cowork 功能,不就是办公神器么?

现在有各种各样的Work工具,腾讯workbuddy,字节的traework,豆包专业版等等。其实最关键的还是底层模型和Harness的调教。这方面Claude Cowork绝对是鼻祖级别的存在了!
总结:
现在 Sonnet 5 真的是媲美 Opus 4.8 的存在了,成为了 Claude 系列中最具性价比、最适合日常工作的模型,也完全可以拿来做编程工作。
Anthropic 对我还算友好,账号一直都在,所以我也一直免费给他们做“自来水”,实话实说,他们家的产品确实是最硬核的存在!
真正的智能是:这道题,它没见过,但是能做对。 目前大部分模型只是应试教育,只有Claude家的模型有一点智能!