28个大模型,免费,在线体验!包括GPT4,Gemini Pro,Claude2

发现一个很不错的演示网站,给大家分享一下!

https://chat.lmsys.org/
通过这个网站可以:

  • 和28个大语言模型对话,
  • 让大模型随机PK,
  • 指定两个大模型进行PK,
  • 查看大模型排行榜。

上面的所有操作,都不需要注册,登录,付费。只要打开网址即可体验!

这28个模型包括目前全球最强的GPT-4-Turbo。

另外还包括

第一梯队在线模型:

  • GPT3.5
  • Gemini Pro
  • Claude2

第一梯队开源模型:

  • Llama2
  • Qwen
  • Yi-Chat
  • ChatGLM
  • Code Llama
  • WizardLM
  • …..

反正市面上大部分模型都包括了。

你想快速体验各种AI聊天模型,这绝对是一个不错的选择。

下面来看一下具体有哪些玩法!

同时来看看,谁才是实打实的大语言王者。

 

1. 模型大乱斗

打开网站之后,默认就是在竞技场(战斗),其实就是28个模型大乱斗。

规则很简单:

打开网页后,系统自动抽取两个大模型,不显示模型名称。

你发起聊天,然后根据它们回复,进行打分。

系统根据大量的打分形成一个排行榜。

这种设计还挺有意思,这样就可以收集真实用户的反馈。GPT官方聊天有时候也会出现两个并排的结果,让你选哪一个比较好。

这样测试的结果,要比刷各种基础测试有意义。

 

下面来举个例子,我直接输入一个问题“爸爸的爸爸的女儿叫什么?”

①的地方输入问题,按②开始提问。

提问之后,会有A和B两个匿名模型来回答你的问题。

你可以通过③④⑤⑥来进行评价。

通过点⑦可以开始新一轮PK,会重新抽两个大模型。

通过点⑧可以在当前的基础上,让模型重新回答一次。

我不清楚这是哪两个模型,从结果来看,都有点蠢。

左边的比右边的好一点。

 

2.指定模型PK

匿名有利于公平公正统计真实反馈,但是你不知道到底是谁在和你对话。如果你想直接指定两个大模型进行PK,那么可以使用第二个功能竞技场(并排) ,其实就是一对一PK。

这个界面上,就可以自己选择两个模型了。

同样的问题,我指定了GPT4和Claude来回答。

结果很明显,GPT4完胜。claude虽然号称openai的劲敌,实际上差距还是很大,有些时候甚至不堪一击。

做一个专有领域的大模型,相对简单。

做一个全球最大的通用大语言模型,不是一件简单的事情。

 

3.直接聊天

不想PK,只要想安静的聊天,那么就使用下面的功能。可以找一个大模型,一对一谈心。

同样的,28个模型任你选。

正常聊天,应该是没有条数限制的。

 

4. 排行榜

到底谁是最强的模型,这往往是大家最喜欢讨论,最关心的问题。

那么,我们可以来看看排行榜。

从描述看,这是100K+用户投票后产生的榜单,应该说是有很大参考意义的。

从榜单可以看到,OpenAI推出的GPT4,占据了前三位,GPT3.5的排名也不错。

除此之外就是Claude, Gemini Pro。

前面两个大家都很熟悉,Mixtral 可能不太熟悉。

Mixtral 8x7B是一个由Mistral AI团队开发的大型语言模型,属于稀疏混合专家(Sparse Mixture of Experts,简称SMoE)模型。

 

这个模型继承了Mistral 7B的架构,但每层由8个前馈块(即“专家”)组成。在处理每个词汇时,每层的路由器网络会选择两个专家来处理当前状态并结合它们的输出

这个思路还挺有意思的,用的巧劲,以小博大。

比较可惜,这里面没有星火,一言,千问,无法进行正面PK。

不过结果其实也是可想而知。

虽然大家都说要赶超GPT4,但实际上是GPT4一骑绝尘。差距并没有缩小,反而有变大的感觉。

 

从投入和关注度上也完全不在一个级别。

强者恒强,在可以预见的未来,ChatGPT将遥遥领先同行。

 

最后备注一下,经过测试,这个网址也需要需要魔法才能打开

这么好的网站,它竟然需要魔法,还有天理么?

最后还是强调一下。

白嫖虽然很好,但是价值守恒,一分钱一分货。

相比GPT4官方版,还是有很多差别,这个只能作为体验。

真要作为生产力高频使用,还是推荐搞一个官方版

开通方式可以参考:

GPT4 Plus最新开通记录!简单,稳定,高效!

封面和上图由GPT4生成

本文无需分享 ,默默使用就好!

可以动动手指,点个赞!

 

小尾巴==========================
公众号:托尼不是塔克
交流群
知识星球
==============================

 



发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注