测试游戏结果,AI绘画与猜谜能力的较量

小编 2024-11-25 04:52

本次测试由知名科技媒体量子位发起，旨在通过“你画我猜”这一趣味游戏，评估大模型在绘画和猜谜方面的能力。测试参与者包括GPT-4o、Claude、Llama、Gemini、Grok等知名大模型。

测试共进行了6局游戏，每局游戏由一名大模型担任“画家”，其他模型则根据画作内容进行猜谜。以下是部分测试结果：

第一局：Grok画长颈鹿，Claude猜中

在第一局游戏中，Grok负责绘画，它画了一幅长颈鹿的画作。经过几轮猜测，Claude成功猜出了答案，赢得了这一局。

第二局：GPT-4o画龙卷风，猜谜结果令人困惑

第二局游戏中，GPT-4o负责绘画，它画了一幅龙卷风的画作。由于画作较为抽象，猜谜结果令人困惑，其他模型并未猜出正确答案。

第三局：Gemini画房子，Llama猜中

在第三局游戏中，Gemini负责绘画，它画了一幅房子的画作。经过几轮猜测，Llama成功猜出了答案，赢得了这一局。

第四局：Grok画草地，Claude猜中

第四局游戏中，Grok再次负责绘画，它画了一幅草地的画作。经过几轮猜测，Claude成功猜出了答案，赢得了这一局。

第五局：Gemini画海洋，Llama猜中

第五局游戏中，Gemini负责绘画，它画了一幅海洋的画作。经过几轮猜测，Llama成功猜出了答案，赢得了这一局。

第六局：Grok画大象，Claude猜中

在第六局游戏中，Grok再次负责绘画，它画了一幅大象的画作。经过几轮猜测，Claude成功猜出了答案，赢得了这一局。

通过本次“你画我猜”游戏测试，我们可以看出大模型在绘画和猜谜方面具有一定的能力。在简单的题目上，大模型能够迅速猜出答案；而在复杂的题目上，则需要经过多次尝试。这表明大模型在处理复杂任务时，仍需不断优化和改进。

软件开发之家安卓版