GLM-5V-Turbo多模态测试,克隆Claude官网!
因为 GLM-5V 的基准数据非常出色,官方的视频演示也非常诱人。
所以我一直想测试一下它的实力。
上次小试牛刀,让它克隆一个表格样式。
今天来个大的。我直接让它克隆 Claude 网页版。
没想到啊,没想到啊,没想到啊。
我略微一出手,它又被玩坏了!
我现在肝火已经有点旺了,又要骂“若智”了。
我给你们还原一下我的测试过程,你们感同身受一下,用这种工具会不会很生气。
我这次测试的主要输入为图片和文字提示词。
参考图
为了让模型有足够的参考样式,我提供了 Claude 官网的 6 张图片。
全局图,左侧菜单收起状态:

全局图,左侧菜单展开状态:

模型选择列表:

设置和语言选择菜单:

输入内容之后:

发送返回之后:

这 6 张图,已经比较完整地展现了这个网站的主要功能样式。对 AI 来说,应该已经够用了!
提示词
上面截图其实也是提示词的一部分,因为图片较多,所以我是专门放在 docs 目录下面。
然后,完整的提示词如下:
参考 docs 下的所有图片制作网页,要求完美还原设计稿。
包括配色,图标,布局,字体,功能菜单等方面。
并且要使用 Anthropic 协议实现基础的聊天对话功能,
其他功能只需要完成 UI 展示和互动即可,无需实现具体功能!
调用的接口信息如下:
"baseURL": "https://open.bigmodel.cn/api/anthropic"
"apiKey": "xxxx"
"models": [
"glm-5.1",
"glm-5-turbo",
"glm-5",
"glm-4.7",
"glm-4.5-air"
],
"selectedModel": "glm-5.1",
从提示词可以看出来,我主要给了两个任务。
- 复刻这个网站的界面!
- 实现基础对话功能!
运行过程
然后我专门创建了一个叫 CopyClaude 的文件夹,用来存放不同模型的测试结果。 给 GLM-5V 专门创建了一个文件夹,用来放置它生成的代码。 
然后直接把这个目录拖动到 JCode 中:

因为我已经配置好了 GLM-5V-Turbo,所以可以直接启动,并调用 GLM 的 API 来完成开发。
启动之后,输入我的需求,直接开干:

到这里一切正常,它正常读取了 6 个文件。 它表示已经完全理解这 6 张设计稿。 然后就开始构建 Claude 风格的聊天界面了。 然后……就开始进入“无尽模式”了。

一直写文件错误,写了十几分钟!
我该给的权限都给了,实在看不下去了,我就中断了。
重新来过!再给他一次机会。

二次启动,依旧失败!!!
我是受不了模型太蠢的,到这里我情绪状态已经比较差了。
我问它为什么失败,然后又卡住了,卡了好几分钟。
很久之后,它告诉我“抱歉,调用工具时参数丢失了”。
然后说重新写入文件!
然后,又来了一个 Error writing file。 然后,又来一个“工具调用似乎遇到了参数传递问题,让我重试。” 然后,又 Error writing file。
这次又干十几分钟。

无果!
卧槽,这谁受得了啊!
我用 AI 是为了提高效率,减少心力消耗,现在好了,不减反增!
目前我不知道怎么往下搞,只能先搁置了!
等弄明白了,再测试多模态效果!
我对 GLM 并无偏见,而且是有点偏向于它的。
因为它的 GLM5 在之前修改 CodingPlan 的代码中表现是国产最佳! 但是这个 GLM-5V 整体来说实战能力还是很弱。
虽然基准中和演示中各种牛逼,但是实战就是实战,一旦“上班了”,不能干就只能滚蛋。
这个问题优化起来应该不难,希望下一个版本能改善!
文章写完的时候,我其实已经测试了 Opus 4.6 和 Qwen3.6 Plus,你们猜猜结果如何?