我发现一个案例,让AI绘图完全失败,包括最新的GPT-4o也无能为力
前几天在论坛上看别人激烈辩论 AI 是否会取代工程师,突然有人在回复中冷不丁的抛出一个评论:
别说那么多废话,先让 AI 画个左撇子出来。
这是个什么问题?
我第一直觉对这个表示怀疑,强如 GPT-4o,连刘强东都能画的和真的一样,怎么会画不出来左撇子。
但在好奇心的驱使下,我还真的试了一下,发现这个问题没这么简单。
提示词很简单:
“画左撇子喝水的图”
Grok
这一上来,就失败的干干脆脆。
有没有可能是偶发?我又多试了几次:
果然是稳定的失败。
Gemini 2.5 Pro
好好好,Gemini 也不行.
那目前最强的 GPT4o 总没问题吧?
GPT 4o
没想到 GPT4o 也不行,真的是打了我的脸.
外国 AI 不行,我们再来看看国内的:
豆包
可灵 AI
试了好几次,都是这个效果,只能说:
即梦
即梦偶尔有概率生成左手拿杯子的,但也就是非常“偶尔”而已。
整体来说,目前我们能接触到的 AI 绘图工具,在这个项目上几乎全军覆没。这是我万万没想到的。
这个“离谱”的测试结果,会不是因为“左撇子”表述有歧义,“喝水”这个项目是个特例?
为了消除这两个怀疑,我重新构建了提示词:
“画一个用左手握笔写字的人。”
大家直接看结果:
上面分别为 Grok,GPT4o 和豆包,全军覆没。
其它模型结果我就不贴了,结论也是一样。
那是不是 AI 分不出左右?
用下面的图进行测试,让 AI 回答下图是哪个手。
上面三张图分别是 Grok,Gemini 和豆包,确实是左右都分不清。
只有 GPT-4o 答对了。
为了防止 GPT4o 蒙对,再给它加测一题:
依旧正确的判断出拿杯子的手是左手。(其它模型我也测了,它们依旧失败)
结论
这个简单的测试,直接暴露了现在几乎所有 AI 绘图模型都左右不分。
Gemini,Grok 和豆包、可灵是完全不分左右,它们画不出来,倒也情有可原。
GPT4o 是在能分清左右的情况下,依旧无法生成“左撇子”有关的内容,这就很有意思了。
所以,它们依旧不懂物理规律。
产生这种现象的最直接原因是左撇子仅占全球人口的 10-15%,因此绝大多数训练图像都右撇子。
而且训练 AI 的数据集中,一般也不会标注出“左手拿杯子喝水”这种比较细节的内容。
因此,AI 会简单的认为:喝水=右手动作。
只是根据其数据集的统计概率生成图像,不是真正的理解。
所以,AI 就是稳定的无法画出“左撇子”的任何动作?
至少对 GPT4o 来说,实际情况比这个更复杂。
不信?你可以让 GPT-4o 画下面这个图:
“左撇子拿书。”
发表评论