2024年6月19日

AI大乱斗：识别图中人物，ChatGPT碾压谷歌和国产AI产品

By tony AI聊天评论 0

欢迎来到AI大PK系列文章，今天要考验国内外AI助手的问题是：图片中的都是谁？

最近这波人又在开小会，搞事情了。很多人可能认不全里面的人，包括我。所以突发奇想，让AI来帮忙。

本以为这是小菜一碟，没想到是大型翻车现场！！！

尤其是号称国内第一的百度AI，真是没有对比就没有伤害，一对比全部露馅了。

下面来看一下具体的问答情况。

ChatGPT

OpenAI的ChatGPT回答如下：

因为有几个我也不认识，所以抽着来检查下。

第三个是加拿大总理，第六个是美国总统，第八个是英国首相。

顺序，国家，名称全对。

另外人物数量也是全对。

另外做了简单的概括，包括地点，时间，事间全部正确。

看到ChatGPT的表现，我感觉这个问题对AI来说可能太简单了。但是，我显然想得太简单了！

谷歌双子座Gemini

谷歌双子座，直接放弃回答。表示还在学习中…

谷歌是成名已久的科技公司，有全球第一的搜索引擎，主导了安卓系统，还有Gmail，Chrome都知名产品。但是在AI这方面，显然是起步晚了，给人巨头迟暮的感觉。

百度文心一言

百度是国内第一个发布大语言模型的公司，一直号称自己ALLINAI。上面的结果，乍一看也挺不错，要比谷歌好多了。

但是细看，就会发现问题很大。

首选人物数量错了，图片中是九个人，它识别出了10个。

其次顺序错了，第一个绝对不是🇨🇦总理，第二个也绝对不是法国总统…

无中生有，莫迪表示谢谢你！

顺序混乱，无中生有，这种扭曲的信息，还不如像谷歌一样直接说不知道呢！！！！

月之暗面Kimi

Kimi有一段时间很火啊。全网都在夸，它的体验做的还不错，但是有点投机取巧的感觉，底层的模型能力其实比较一般。

多模态的理解能力几乎为零。

它只是简单的识别出了文字内容，没有理解图片中的人物和位置关系。

讯飞星火

讯飞我一直感觉还比较踏实的，但是随着大家快速发展，它明显有点跟不上了，它的表现和谷歌类似，直接摆烂。能力不行，但是至少坦白。没啥好多说的了。

阿里通义千问

千问在开源模型这一块做的非常好，但是能力上限，还是比较有限。

直接把马克龙和老拜之间的女士给省略了。

直接把日本首相替换了韩国总统…

直接自己添加了比利时，印度尼西亚…

它和百度一样

数量不对

人物不对

顺序不对

简单总结下：

这个多模态的识别问题，其实还是有点难度的。首先要识别人，其次要识别是谁，最后还要正确理解左右顺序。

这一圈看下来，我标题说的应该不算夸张了吧！

ChatGPT依旧真的遥遥领先，讯飞和谷歌还算诚实，不会就是不会，起码尊重事实，这应该比较像理科生。

百度和阿里，属于明明不太会，但是又装作很懂，满嘴跑火车，有点像文科生。

事实不重要，重要的是看起来我很会～哈哈哈！

今天的PK就到这里了！

如果你觉得有用，可以点个赞，分享一下。

标签:AI对话, AI聊天, ChatGPT

小尾巴==========================
公众号：托尼不是塔克
 交流群
 知识星球
==============================

关于作者

tony

某人