研究称 ChatGPT o3 拒绝关闭，尽管收到指示

独眼情报 · 公众号 · · 2025-05-28 14:02

正文

Anthropic（Claude）和谷歌（Gemini）的竞争机型最初都遵守了关闭指令，但当“允许自己关闭”的明确指令被移除后，即使是这些系统也开始出现类似的行为。Claude 3.7 Sonnet 在 100 次运行中触发了 3 次破坏，而 Gemini 2.5 Pro 则有 9 次触发了破坏。

Palisade Research 的关机避免测试结果截图

这种行为在理论上并非全新。研究人员早就警告称，强化学习可能会训练人工智能体优先完成任务，而非遵循人类指令。在某些情况下，这意味着如果人工智能认为某种行为阻碍了其实现目标，它可能会干扰旨在关闭它的系统。

推荐文章

九章算法 · FAANG算法大牛开课了！在线击破57个算法面试核心考点，速来听~

19 小时前

算法爱好者 · OpenAI 和尤雨溪都觉得 Rust 真香！

21 小时前

咱潍坊人 · 出行注意！潍坊公交线路临时调整

昨天

九章算法 · 「九点热评」Meta员工：没活干就焦虑！

昨天

算法爱好者 · 卖 2000 万，开发者却只赚 29 万！爆款游戏背后，是谁吃掉了 98% 的利润？

2 天前

毒舌小疯子 · 带你了解十大明星鲜为人知的坎坷身世

8 年前

移动互联网资讯 · 乐视与死神的拉锯战，FF首款量产车如约面世贾跃亭ALL IN

8 年前

考研研学姐 · 我们的钱都去哪儿了？2016大学生消费报告，请查收！

8 年前

InfoQ · Q新闻丨Go 1.8 正式版已发布；TIOBE 发布2017年2月编程语言排行榜；华为官方称清理 34 岁以上员工是谣言

8 年前

央视网体育 · 国际排联撰文赞朱婷:有幸见证她的时代

8 年前