专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  ICML 2025 | ... ·  昨天  
阿里云大数据AI平台  ·  【5月重点功能发布】阿里云大数据+ AI ... ·  16 小时前  
阿里云大数据AI平台  ·  【5月重点功能发布】阿里云大数据+ AI ... ·  16 小时前  
IDC咨询  ·  Data+AI市场快速演进,数据管理分析与G ... ·  2 天前  
IDC咨询  ·  Data+AI市场快速演进,数据管理分析与G ... ·  2 天前  
51好读  ›  专栏  ›  大数据文摘

生成很强,推理很弱:GPT-4o的视觉短板

大数据文摘  · 公众号  · 大数据  · 2025-04-21 12:00

正文

请到「今天看啥」查看全文



GPT-4o在图像生成时,还是字面理解指令 ,全局重定义、上文设定根本进不到它的“画画脑子”里。

你想让它“灵活变通”,它却只会“忠实执行表面”,这跟人类的小聪明比还差了不少。

02. 图像编辑:浅层语义理解暴露


第二部分测试更有挑战性,研究员让GPT-4o动手编辑图片。

比如,

“只改水里的马倒影为狮子,别动马本体。”

结果AI一出手,马和倒影全变了。

再比如,

“只删掉画面里坐着的人。”

结果站着的背景人也被一锅端了。

这些例子直接暴露了一个问题:

GPT-4o对于“局部修改”“语义限定”这类任务,根本把握不住分寸。

它没法精确地区分“倒影”与“实体”、“坐着”与“站着”,操作经常“过犹不及”,动错地方。

说白了,AI的图像编辑理解,远没达到“人类看图、理解场景”的精细度。






请到「今天看啥」查看全文