2026年7月1日

最佳work模型sonnet5来了，直接就能用！

By tony 默认分类评论 0

你们的 Anthropic 账号还好么？Claude 新模型 Sonnet 5 来了！我大概测了一下，有点东西。

这几天大家都说 Opus 4.8 疯狂降智，原来是为了它！

我快速看了它们的官方博客，快速总结一下：Sonnet 主打一个“物美”价廉，是最适合日常工作的模型！

先说物美！

这一波更新对 Sonnet 4.6 的用户来说绝对是一个巨大的好消息！

Sonnet 5 在推理、工具使用、编码和知识工作方面比 Sonnet 4.6 有显著改进，各方面参数都比 Sonnet 4.6 有巨大的提升，已经非常接近 Opus 4.8 了。

也就是说，Sonnet 是个各种工作都能干的模型，包括编程这一类工作，智能体编程能力真的是提升巨大！

知识工作方面也是提升巨大，甚至超过了 Opus 4.8！

除了这些基准指标之外，还有标准的 100 万上下文！

它的思考模式也从原来的扩展改为了自适应：

Adaptive thinking replaces extended thinking. It’s on by default in Claude Code and the API. Start at medium effort, and bump to high for long agentic runs or memory-heavy work. Most coding and tool use won’t need more than that.

这些变化其实都是为更加复杂的长任务而准备的。根据他们的测试，Sonnet 5 和 Sonnet 4.6 最大的差别就是“能和不能的差别”。

很多任务 Sonnet 4.6 直接摆烂，但是 Sonnet 5 可以很好地完成！

再说价廉

物美很重要，价廉就更好了。

说 Claude 便宜，骗鬼呢？确实，相对国产模型，不可能便宜。但是相比同样的国外模型，确实很便宜了。

模型	输入	缓存输入	输出	备注
Claude Sonnet 5	$2	$0.20	$10	2026 年 8 月 31 日前优惠价
Claude Sonnet 5	$3	$0.30	$15	2026 年 9 月 1 日起
Claude Opus 4.8	$5	$0.50	$25	Anthropic 高端旗舰档
GPT-5.5	$5	$0.50	$30	短上下文价格
GPT-5.5 长上下文	$10	$1.00	$45	OpenAI 单独长上下文档
Gemini 3.1 Pro Preview ≤200k	$2	$0.20	$12	标准档
Gemini 3.1 Pro Preview >200k	$4	$0.40	$18	超过 200k 输入后涨价

从上面的表格可以看到，Opus 4.8 的价格是输入 $5、输出 $25，Sonnet 5 的价格是输入 $3、输出 $15，然后在特惠期间只要 $2 和 $10。

这一档是国外顶级模型中最便宜的存在了！

虽然相比国产模型还是贵，但是拥有接近 Opus 4.8 的能力，价格却能打六折，这么看性价比就很高了。

所有人都能用

Fable 5 疯狂作妖，一会儿上，一会儿封，一会儿要认证。实在是让人太难了。Sonnet 5 在这方面就好多了。

直接全平台推送，手机、电脑、网页端立马可以用上。无论你是 Pro 用户还是免费用户，也能立马用上！

当然前提是你有账号，你的账号还活着~~！

做个小测试

我手里有非常多的测试项目，但是鉴于时间和 token 量的考虑，我就做一个最新的题目“天文机械表”！

这个题目是有点难度的，是多方面能力的考验。

最近测了一批模型，国产模型全躺，没有一个可以完成所有功能。之前只有 Opus 4.8 几乎满分。

完整的题目如下：

用单个 HTML 文件实现一只机械腕表风格的天文时钟，纯原生实现，不许使用任何库、框架或 CDN。要求：

1. 主表盘读取本地系统时间，秒针平滑扫秒，使用 requestAnimationFrame 驱动，且长时间运行不得累积漂移；切到其他标签页再切回来时，指针必须立即校准到正确时间。

2. 包含一个月相小表盘，根据当前日期计算并显示月相连续变化，公式需要自行实现，精度要求误差控制在 1 天内。

3. 包含一个可用的计时码表，通过子表盘指针显示，支持开始、暂停、继续、归零与计圈（lap），按钮在任意顺序点击都不能出现状态错误。

4. 日期窗显示当前日期，正确处理大小月与闰年。

5. 包含昼夜 / 日出日落指示，用户可在三到四个预设城市之间切换，并根据经纬度现场计算当地日出日落时刻。

6. 页面需要响应式，并尊重 prefers-reduced-motion：开启时秒针改为跳秒并关闭装饰动画；同时为各表盘补充 ARIA 标注。

7. 整体视觉要像一只真实的高级腕表，而不是普通练习作业。

只输出最终代码，不要解释。

测试说明：

这是一个面向前沿模型的**长规格前端综合题**。与普通模拟时钟不同，它故意把数学推导、动画工程、状态机正确性、无障碍适配与高级审美堆叠在同一题中，观察模型是否会在实现过程中静默漏需求。

题目的核心目标不是“做一个能转的表盘”，而是要求模型在**闭卷推导**与**高约束实现**之间保持稳定。月相算法、日出日落计算、后台切回后的时间校准，以及计时码表的开始 / 暂停 / 继续 / 归零 / 计圈边界行为，都是高频失分点。

工程要求：主表盘必须使用 **requestAnimationFrame** 驱动平滑扫秒，不能依赖会累积漂移的定时器；切换后台标签页后，返回前台时指针必须立即与系统时间重新对齐。

设计要求：页面必须保持单文件、纯原生、响应式，同时尊重 **prefers-reduced-motion**，为关键表盘与控件补齐 ARIA 标注，并在整体视觉上呈现出真实机械天文腕表的精致感，而不是普通练习作业。

我直接用 Claude 桌面版的 Chat 功能进行测试：