正文
图注:从V3-V5,手指表现的改进
但到此时,AI生成的手指还有一些瑕疵,比如它的肌肉纹理并不自然。
图注:V5生成的手,有时候用力过猛
到了2024年7月,最新版的Midjouney V6.1已基本解决手指问题了,甚至将手部细节做到相当完美逼真了。
虽然AI生图的真实度一直在加强,但它也不是完全完美的。只是普通人想识别出它的异样,还是有点难。
比如在2024年6月,美国西北大学专门出了一份54页的手册,帮你辨别AI生成内容。
在手册中,他们提到了五种核心辨别AI造假的方法。首先是解剖学上的不合理,比如手部的不自然、骨骼惊奇、牙齿奇怪。
第二是风格化,如果画面看起来太干净、或者过分有电影感,这都可能是AI造假的。
第三是功能上的不合理,AI对很多功能性产品的理解有限,因此会常常表现很模糊,或者不对劲。比如把镜子放在床后面,正常人都不会干这事儿。而且目前能够正确显示汉字的AI生成模型还寥寥无几。
第四是违反物理规则,比如反光和影子不正常,镜中倒影也不对劲。
第五是文化或常识上不合理,比如川普加入黑人女性排队(川普是个白人种族主义者,不可能加入女黑人的派对),或者穿着泳衣去葬礼。
然而,整本手册一直在提醒我们注意,这些错误在多次生成、或者降低Prompt复杂度的情况下是可被避免的。
那些有意产生看起来足够逼真AI画面的人,还是可以通过反复生成,调整提示词来扬长避短,“欺骗”你的眼睛。
而且部分细节上的“不对劲”,如果不是仔细看,人类是无法分辨的。
对于这一点,美国甚至政府部门都上阵做了考察。
早在今年三月,美国政府战略研究中心网络安全计划就做了一项研究。他们发现,人们识别AI生成内容(包括图像、视频和声音)的综合准确率仅有51.2%,接近随机掷骰子的水平。
在所有类型的AI生成内容中,图像是最不容易识别的,准确率仅有49.4%,比瞎猜都差。
而其中人脸图像更难识别,正确率仅有46.6%。而且这还是上一代图像和视频生成模型下的结果。看看下面这些具体的图像,和当前的AI生成技术水平还是有点距离。