测试游戏结果,AI绘画与猜谜能力的较量

小编

大模型“你画我猜”游戏测试:AI绘画与猜谜能力的较量

测试背景与目的

本次测试由知名科技媒体量子位发起,旨在通过“你画我猜”这一趣味游戏,评估大模型在绘画和猜谜方面的能力。测试参与者包括GPT-4o、Claude、Llama、Gemini、Grok等知名大模型。

测试过程与结果

测试共进行了6局游戏,每局游戏由一名大模型担任“画家”,其他模型则根据画作内容进行猜谜。以下是部分测试结果:

第一局:Grok画长颈鹿,Claude猜中

在第一局游戏中,Grok负责绘画,它画了一幅长颈鹿的画作。经过几轮猜测,Claude成功猜出了答案,赢得了这一局。

第二局:GPT-4o画龙卷风,猜谜结果令人困惑

第二局游戏中,GPT-4o负责绘画,它画了一幅龙卷风的画作。由于画作较为抽象,猜谜结果令人困惑,其他模型并未猜出正确答案。

第三局:Gemini画房子,Llama猜中

在第三局游戏中,Gemini负责绘画,它画了一幅房子的画作。经过几轮猜测,Llama成功猜出了答案,赢得了这一局。

第四局:Grok画草地,Claude猜中

第四局游戏中,Grok再次负责绘画,它画了一幅草地的画作。经过几轮猜测,Claude成功猜出了答案,赢得了这一局。

第五局:Gemini画海洋,Llama猜中

第五局游戏中,Gemini负责绘画,它画了一幅海洋的画作。经过几轮猜测,Llama成功猜出了答案,赢得了这一局。

第六局:Grok画大象,Claude猜中

在第六局游戏中,Grok再次负责绘画,它画了一幅大象的画作。经过几轮猜测,Claude成功猜出了答案,赢得了这一局。

通过本次“你画我猜”游戏测试,我们可以看出大模型在绘画和猜谜方面具有一定的能力。在简单的题目上,大模型能够迅速猜出答案;而在复杂的题目上,则需要经过多次尝试。这表明大模型在处理复杂任务时,仍需不断优化和改进。