98%命中率!Claude+Opus4.7也太强了吧!
不得不说,Anthropic 的 Claude 是真的牛逼啊!

看到这张图的数据我都惊呆了!
最近 Anthropic 和 SpaceX 合作,五小时配额翻倍,抠抠搜搜的 A 社这么大方,世所罕见。
我就非常好奇,这五小时到底给了多少 tokens!所以我计划一次性把五小时配额用完,然后统计一下消耗的 token 量。
然后,突然发现 Opus4.7 的命中率居然高达 98%!
下面我们就详细地来看一下,Claude 上下文、tokens 消耗、命中率的问题。
先来看一下这个五小时周期的消耗情况:

早上我一直在升级我的 JCode 软件,修改了好多功能,居然只消耗了 48%,翻倍之后果然更加耐用了,体感非常明显。因为功能已经改完了,所以我就不继续消耗了!
先简单看一下早上都干了什么活:
refactor(Proxy): 重构代理页面布局并排除默认 Claude 平台
- 将控制面板移至底部,优化说明信息为列表形式
- 调整保存按钮位置至映射规则标题行
- 过滤掉默认 Claude 平台,避免其作为代理目标
- 移除未使用的 Label 组件导入
feat: 添加页面布局组件并重构子页面导航
- 新增 PageActions 和 PageFooter 组件,用于将内容渲染到标题栏操作槽和全局底部槽
- 重构 TitleBar 组件,支持子页面显示返回按钮、图标和自定义标题
- 在 App.tsx 中添加底部槽位容器,用于 PageFooter 内容挂载
- 更新所有子页面(设置、统计、批量测试、平台编辑、代理)使用新的布局组件,移除重复的页头代码
- 优化平台图标,将首页添加平台按钮的图标从 Plus 改为 CirclePlus
- 在预设模型列表中添加 Ollama 平台支持及相关模型
- 更新本地开发配置,添加图标获取相关命令
feat(stats): 优化模型使用详情显示,增加缓存命中率
- 引入 ArrowUp 和 ArrowDown 图标区分输入输出
- 将模型明细拆分为两行,分别显示占比和分项详情
- 在缓存命中项旁显示命中率百分比
- 调整间距提升视觉层次感
这是我代码提交的记录。
有些条目虽然轻描淡写,但是也挺消耗 tokens 的。
因为,我这个软件,当前已经有不少功能了。所以肯定有不少上下文!

从图中可以看到我的上下文已经达到了 280K,也就是 100 万上下文窗口中的 28%!
很多上下文小一点的模型,直接就撑爆了,需要压缩了。
Opus 4.7 毫无压力,而且智商在线,指哪打哪。
然后我们来看一下消耗了多少 tokens。

根据统计,总共消耗了 32.7M tokens,如果这个数字不直观,我就转换一下,上午总共消耗了三千多万 tokens!
然后我们再来深入看一下底部的一行记录。
这里记录了几天使用的模型,以及输入,缓存命中,缓存写入,输出等数据。
我今天没有用任何其它模型,就是 Opus 4.7 xhigh!
下面是最近七天的数据,其实就五天有数据:
输入(input):5.1K
缓存命中(cache_read): 99.8M
缓存写入(cache_creation): 1.7M
输出(output): 559K
统计软件里面还专门标注了一个98%的数据。
前三个数据应该都算输入,后面的是输出!
总的 tokens 计算公式:
let total = usage.input_tokens
+ usage.output_tokens
+ usage.cache_read_input_tokens
+ usage.cache_creation_input_tokens;
这里有两个数据是非常出乎我的意料的。
第一个是五小时配额的情况,我之前专门询问过 Grok。

Grok 说 Pro 的五小时配额大概才 44,000 tokens。
我强烈质疑它,但是它咬死了就是这个数据!
我是绝对不信它的,但是我感觉确实也不会太多。
今天一测,发现比我设想的要多很多,我们上面已经看到了 45% 的情况下,当日总消耗 tokens 为 32M 左右。
虽然,从图表中无法看到今日的细分,但是32M总量是没跑了!
第二个让人惊讶的是,它的缓存命中率 98%!!!
我让它查了一下当天的命中率 99%!
这个数据实在是太惊人了!
用同样的统计标准,对比一下国产模型。
下面是 DeepSeek 的数据:

我看过后台的数据和这个统计数据是一致的。

下面是智谱 GLM 的数据:

下面是 MinMax 的数据:

下面是 Kimi 的数据:

因为任务不一样,场景不一样,具体的数值可能会有差异,但是总体来看 Claude Code + Opus 4.7 的缓存率是领先很多的!
我特意查了一下,这个缓存命中率跟什么有关。这个应该是跟软件系统的工程实践有很大的关系,这是一个系统工程!大家天天吐槽 Anthropic 不做人事儿,但是又都跑去用它家的软件,其实大家都不傻的。
A社的实力,绝对是顶级的存在,无论模型还是软件!
最后说一个细节,如果想要省 tokens,记得在 5 分钟内,不间断提问!
在一个 session 中,一段时间内把核心功能和后续的调整全部搞定。
这个主要针对当前的 CC!
节奏把握好,技巧用到位,同样的五小时配额,可以比别人多干很多活哦!
我觉得我省着点用,Pro 也够。Codex 也能干不少事儿。