我超!Claude真是强到变态!
今天和 Claude Desktop 聊天,我本来是想咨询一下技术方案。
没想到它直接帮我把软件都写好了。

太震惊了,不带这么玩的啊,你让别人怎么玩啊!!!
情况是这样的,有人说 Qwen3.5 的请求是真的按次数计算的,tokens 配额很多。
然后就激发了我的好奇心,想测一测它这个 5 小时 tokens 到底有多少。
然后我就去问 Claude 了:
我现在开通了很多 Coding Plan 的订阅计划,它们都是按 5 个小时重置一次,然后一周有一周的用量,一月有一月的用量。我现在想要测试一下,在 5 个小时内大概有多少 token 分配给我。我有什么测试办法吗?我想针对不同平台用同样的规则去测试,也就是测试出这 5 小时的极限。
然后我就开始坐等它的方案了。
它很快给我了测试思路:
测试思路
核心问题:不同平台的"5小时额度"限制,到底是限制:
1. Token 总量(输入 + 输出)?
2. 请求次数?
3. 输出 Token(更常见)?
4. 还是混合限制?
测试策略:压力测试法
用一个固定的"重型 prompt",反复调用,记录每次的:
- 输入 token 数(固定,可预测)
- 输出 token 数(让模型尽量输出到 max)
- 累计消耗
- 触发限流的时间点
关键设计:
- 用相同的 prompt 模板跨平台对比
- 每轮请求后立刻记录,触发限流即停止
- 推算出 5 小时窗口的 token 上限
我觉得这思路可以,正想问他如何实现。
然后……
它直接在对话框中生成了测试工具:

我也算见多识广了,见到这个还是头皮发麻。其实这个新闻我已经看过,我也发过直接在对话框中制作“交互式复利计算工具”。
但是,没想到,今天这个问题,也能直接在对话框中生成。
实在是太牛了。
我再三确认,你只是给我画了个 UI,还是说可以直接用的?它说可以用的。
我用了一下,确实上面的输入框,功能按钮全都是可以操作的。
它还教了我使用流程:
- 填入平台的 Base URL(例如阿里云百炼是
https://dashscope.aliyuncs.com/compatible-mode) - 填入对应平台的 API Key 和 Model 名称
- 调整「请求间隔」(建议 3~5 秒,防止触发速率限制而非额度限制)
- 点击「开始测试」,让它跑满到触发限流为止
- 触发 429/Quota 错误时会自动停止并输出结论
- 导出 CSV 保存记录,换下一个平台重复
不过,实际运行的时候遇到了 CORS 问题,浏览器阻止了跨域请求。
它立马换了一个方案直接帮我生成了一个 HTML 页面。

页面可以在线预览,然后只要下载到本地就可以运行了。
然后我再配置了一下参数,点击开始测试:

测试成功!
不是显示成功,是真的成功了,模型平台,已经显示了调用量!

TOKENS总量 3945 ,分毫不差!!
其实作为开发者,要理解这背后的原理,也不难。但是它这种直接通过对话框,就帮你制作好工具的方式,体验太好了。
主要是功能完整,没有bug,不需要你再去调教了,直接能用。
这种丝滑感很多AI做不到的。
十秒钟前有一个想法,十秒后,工具就摆在对话框里了。
这对不是太专业,或者根本不是专业人士的人来说,是一个巨大进步,会大幅度提升工作效率和工作体验。
好了,大惊小怪的一天,记录一下首次使用的心理状态。
下一秒开始,别人在给我说这个功能。
我就会说:也一般般嘛,有啥好大惊小怪的,哈哈哈!