Claude Opus4.7 可以扔了,能干却不干!
Opus 4.7 来了,这次抄作业,有点难了。
因为需要 KYC 了!
这几天,不太平啊,网络也不稳定。
我倒是如期用上 4.7 了,但是我有点想把它扔了,不是因为它不强,而是因为它不听话!

我让它直接调用浏览器,克隆 claude.ai,它拒绝了!
而且理由很充分:
- 一方面是涉及到版权问题
- 另一方面是存在钓鱼风险
它明明告诉我已经全部代码都看过了,却告诉我,看了也不给你克隆。
要它何用🤣,扔了!
就像你请了一个员工,叫它去隔壁家抄个作业,它却义正言辞的告诉你抄袭是不对的。
认真讲,我是同意的他观点的,我觉得有这个节操是非常好的,抄袭是的不对的!
但是,这么一搞,我是一点主动权都没有了。 拗不过他,只能按它的方案来搞了。
下面来看一下效果。
这是原网页:

这是它做的:

这是深色模式:

看这结构,它肯定是看懂了,但是不给我 1:1 复刻!还全部给我翻译成了中文,这是要避嫌么?
Anthropic 看来是被蒸馏怕了,推出新模型前还专门搞了 KYC 认证,估计模型训练阶段也做了安全方面的特训。
大模型发展到这个阶段,用户也要被分成三六九等了,大模型公司掌握了生杀大权!
干活也不在全力以赴了,都得留一手。
上面是让它直接去抄代码,它拒绝了,我也试了一下直接扔给它图片,它没有拒绝。
效果如下!
深色效果:

浅色效果:

不说100%,也有个八九十了。
这个还是没改完的半成品,克隆到一半,配额没了!
这克隆效果,比 Opus 4.6 明显好很多了!
色彩准确度更高了,字体相似度也高了,细节完善度也高了,右上角的“小鬼”也有了,只是样式还没改好。
右下角的主题切换,是我让它加的,不是它复刻的问题。
效果提升这么多,应该是得益于多模态能力的升级。
Opus 4.7 的实力毋庸置疑!
以防还有人不知道它更新了什么,我还是贴一下主要更新内容。
这其实是 Opus 4.7 写的“自我介绍”,可以看看它总结的是否精准!
Claude Opus 4.7 更新要点
发布时间:2026 年 4 月 16 日,与 4.6(2 月发布)间隔约两个月。(DeepSeek你看看人家的更新频率啊!)
价格与 Opus 4.6 持平。
一、能力提升
整体在编程智能体、多学科推理、大规模工具调用、agentic 计算机使用等行业基准上全面超越 4.6。Anthropic 定位它为**”目前最强的通用可用模型”,尤其擅长长周期 agent 任务和知识工作。**
二、视觉能力的重大升级
这是 Claude 首个支持高分辨率图像的模型,最大支持 2576px / 3.75MP,相比之前 1568px / 1.15MP 有显著提升。
在低层感知(pointing、测量、计数)和图像定位(自然图像的 bounding box 识别与检测)上也有改进。对你做 JCode 截图分析或视觉 agent 相关的场景会很有用。
三、Thinking 机制的重构
这是对开发者影响最大的一块:
1. Extended thinking 被移除:在 4.7 上设置 thinking: {"type": "enabled", "budget_tokens": N} 会返回 400 错误。Adaptive thinking 是唯一的 thinking-on 模式,Anthropic 内部评估显示它稳定优于 extended thinking。
2. Adaptive thinking 默认关闭:请求中没有 thinking 字段时不会启用思考,需要显式设置 thinking: {type: "adaptive"}。
3. Thinking 内容默认不返回:思考块仍在响应流中,但 thinking 字段默认为空,除非调用方显式通过 display: "summarized" 等方式 opt-in。如果你在 JCode 里有展示思考过程的 UI,需要改代码。
四、新增控制参数
1. Effort 参数:调节智能 vs token 消耗的平衡,coding 和 agent 场景建议从新的 xhigh effort 开始,大多数对智能敏感的场景至少用 high。
2. Task budgets:给 Claude 一个完整 agent 循环的 token 目标预估,包括 thinking、工具调用、工具结果和最终输出。这对做多平台调用对比测试应该很有帮助。
五、新分词器
4.7 使用新的 tokenizer,处理文本时可能比之前模型多用 1x 到 1.35x 的 token(约多 35%,视内容而定),count_tokens 接口返回的数字也会不同。
实际影响:同样的 prompt 在 4.7 上 token 数会比 4.6 多,折算下来虽然官方价格没变,但实际单次请求成本会略升。你做跨平台 benchmark 时需要把这一点纳入考量。
六、采样参数被禁用
temperature、top_p、top_k 设置为任何非默认值都会返回 400 错误,建议完全省略这些参数,改用 prompt 引导模型行为。
七、规格维持
依然是 1M token 上下文窗口、128k 最大输出 token,工具和平台功能集与 4.6 一致。
八、安全与 Mythos 相关
Anthropic 在训练中尝试”差异化削减”4.7 的网络攻击能力,并部署了自动检测和拦截高风险网络安全用途的防护机制。真正更强的 Mythos Preview 走的是 Project Glasswing 白名单路径,不会公开发布。
对你 JCode 项目的几个直接影响:
一是批量测试功能里如果之前为了对比各家平台特意打开了 extended thinking,现在 4.7 路径需要改成 adaptive;
二是流式输出如果原来能看到 thinking 过程,现在默认看不到了,需要在请求里主动 opt-in;
三是 token 计数逻辑要针对 4.7 单独处理,国内平台如果跟进 4.7 也会面临同样的分词器差异;
四是高分辨率视觉输入可以考虑加入对比测试的维度。
这该死的记忆能力,每次都想着我的 JCode!
我不喜欢它记太多,立马打晕,记忆清空,并直接关闭这个功能。
另外,看有人在吐槽 4.7 也不说人话了,我倒是觉得还好。
上面一大段,我都是原封不动拷过来的,说的挺正常的。
不说人话这一点 GPT 已经登峰造极,豆包完美的“学习”到了这一点。
Opus 4.7 在实战中能力肯定会更强,而且是会比对手领先很多。
只是国区的人要用上它真的是越来越难了。
原先是需要国外的“IP、手机、地址、邮箱、卡和美金”,现在还得去找非洲老哥借个 KYC 了!
Pro的小水池的水也是越来越少了!
但是,真 TM 强啊!大部分需求一轮搞定 90%,这谁受得了啊。
我的TokenBox已经被它成功搞出来了,只是还在优化性能和研究部署的问题。
昨天网络不行,搞得我坐立难安!
吸一口,真的就回不去了。
说回标题,我只是一个单纯的标题党,扔是不可能扔的!