2026年5月10日

98%命中率！Claude+Opus4.7也太强了吧！

By tony 默认分类评论 0

不得不说，Anthropic 的 Claude 是真的牛逼啊！

看到这张图的数据我都惊呆了！

最近 Anthropic 和 SpaceX 合作，五小时配额翻倍，抠抠搜搜的 A 社这么大方，世所罕见。

我就非常好奇，这五小时到底给了多少 tokens！所以我计划一次性把五小时配额用完，然后统计一下消耗的 token 量。

然后，突然发现 Opus4.7 的命中率居然高达 98%！

下面我们就详细地来看一下，Claude 上下文、tokens 消耗、命中率的问题。

先来看一下这个五小时周期的消耗情况：

早上我一直在升级我的 JCode 软件，修改了好多功能，居然只消耗了 48%，翻倍之后果然更加耐用了，体感非常明显。因为功能已经改完了，所以我就不继续消耗了！

先简单看一下早上都干了什么活：

refactor(Proxy): 重构代理页面布局并排除默认 Claude 平台

- 将控制面板移至底部，优化说明信息为列表形式
- 调整保存按钮位置至映射规则标题行
- 过滤掉默认 Claude 平台，避免其作为代理目标
- 移除未使用的 Label 组件导入


feat: 添加页面布局组件并重构子页面导航

- 新增 PageActions 和 PageFooter 组件，用于将内容渲染到标题栏操作槽和全局底部槽
- 重构 TitleBar 组件，支持子页面显示返回按钮、图标和自定义标题
- 在 App.tsx 中添加底部槽位容器，用于 PageFooter 内容挂载
- 更新所有子页面（设置、统计、批量测试、平台编辑、代理）使用新的布局组件，移除重复的页头代码
- 优化平台图标，将首页添加平台按钮的图标从 Plus 改为 CirclePlus
- 在预设模型列表中添加 Ollama 平台支持及相关模型
- 更新本地开发配置，添加图标获取相关命令


feat(stats): 优化模型使用详情显示，增加缓存命中率

- 引入 ArrowUp 和 ArrowDown 图标区分输入输出
- 将模型明细拆分为两行，分别显示占比和分项详情
- 在缓存命中项旁显示命中率百分比
- 调整间距提升视觉层次感

这是我代码提交的记录。

有些条目虽然轻描淡写，但是也挺消耗 tokens 的。

因为，我这个软件，当前已经有不少功能了。所以肯定有不少上下文！

从图中可以看到我的上下文已经达到了 280K，也就是 100 万上下文窗口中的 28%！

很多上下文小一点的模型，直接就撑爆了，需要压缩了。

Opus 4.7 毫无压力，而且智商在线，指哪打哪。

然后我们来看一下消耗了多少 tokens。

根据统计，总共消耗了 32.7M tokens，如果这个数字不直观，我就转换一下，上午总共消耗了三千多万 tokens！

然后我们再来深入看一下底部的一行记录。

这里记录了几天使用的模型，以及输入，缓存命中，缓存写入，输出等数据。

我今天没有用任何其它模型，就是 Opus 4.7 xhigh！

下面是最近七天的数据，其实就五天有数据：

输入（input）：5.1K

缓存命中（cache_read）: 99.8M

缓存写入（cache_creation）: 1.7M

输出（output）: 559K

统计软件里面还专门标注了一个98%的数据。

前三个数据应该都算输入，后面的是输出！

总的 tokens 计算公式：

let total = usage.input_tokens
    + usage.output_tokens
    + usage.cache_read_input_tokens
    + usage.cache_creation_input_tokens;

这里有两个数据是非常出乎我的意料的。

第一个是五小时配额的情况，我之前专门询问过 Grok。

Grok 说 Pro 的五小时配额大概才 44,000 tokens。

我强烈质疑它，但是它咬死了就是这个数据！

我是绝对不信它的，但是我感觉确实也不会太多。

今天一测，发现比我设想的要多很多，我们上面已经看到了 45% 的情况下，当日总消耗 tokens 为 32M 左右。

虽然，从图表中无法看到今日的细分，但是32M总量是没跑了！

第二个让人惊讶的是，它的缓存命中率 98%！！！

我让它查了一下当天的命中率 99%！

这个数据实在是太惊人了！

用同样的统计标准，对比一下国产模型。

下面是 DeepSeek 的数据：

我看过后台的数据和这个统计数据是一致的。

下面是智谱 GLM 的数据：

下面是 MinMax 的数据：

下面是 Kimi 的数据：

因为任务不一样，场景不一样，具体的数值可能会有差异，但是总体来看 Claude Code + Opus 4.7 的缓存率是领先很多的！

我特意查了一下，这个缓存命中率跟什么有关。这个应该是跟软件系统的工程实践有很大的关系，这是一个系统工程！大家天天吐槽 Anthropic 不做人事儿，但是又都跑去用它家的软件，其实大家都不傻的。

A社的实力，绝对是顶级的存在，无论模型还是软件！

最后说一个细节，如果想要省 tokens，记得在 5 分钟内，不间断提问！

在一个 session 中，一段时间内把核心功能和后续的调整全部搞定。

这个主要针对当前的 CC！

节奏把握好，技巧用到位，同样的五小时配额，可以比别人多干很多活哦！

我觉得我省着点用，Pro 也够。Codex 也能干不少事儿。

小尾巴==========================
公众号：托尼不是塔克
 交流群
 知识星球
==============================

关于作者

tony

某人

相关文章

关于作者

tony

发表评论