刚刚，ChatGPT上线最强编程智能体

爱范儿 · 公众号 · 科技媒体 · 2025-05-17 09:08

正文

任务完成后，Codex 会输出一整套可追溯的执行结果，包括终端日志、测试记录等验证信息。你可以对修改结果进行审查、提出建议，甚至直接在 GitHub 上发起 PR，或者合并进本地项目。

借助项目中的 AGENTS.md 文件，用户还可自定义 Codex 的行为，让它更贴合具体项目的开发规范与测试标准。

Codex 的核心模型为 codex-1，这是 OpenAI o3 系列里专为软件工程微调过的版本。

基准测试结果显示，codex-1 在 SWE-Bench 的得分为 72.1%，纸面参数优于 Claude 3.7 以及 o3-high。

训练方式也很「实战」，通过在真实开发环境中进行强化学习训练，Codex 能够生成更符合人类编码风格和审查偏好的代码，严格按照指令执行，并不断运行测试，直到测试通过为止。

从今天开始，Codex 将向 ChatGPT Pro、Enterprise 和 Team 用户开放，而 Plus 和 Edu 用户的支持也将很快上线。

安全性方面，Codex 做得也够克制。执行任务时，它只会访问你提供的代码库和预设依赖，不能联网、不能访问外部 API，遇到不确定问题会停下来提示你处理。

并且，Codex 经过专门训练，能够识别并拒绝与恶意开发相关的请求，避免被滥用于开发恶意软件。

目前，OpenAI 已在内部广泛使用 Codex，协助工程师完成重构、命名规范、编写测试等重复性任务，显著提升开发效率。一些外部合作团队也给出了积极反馈，比如 Cisco 与 Temporal 借助 Codex 加快了开发与调试节奏。

推荐文章

新浪科技 · 【#岚图汽车CEO卢放称坚决反对无序价格战# ：内卷之下没有赢家-20250607174600

21 小时前

新浪科技 · 【#雷军第51次健身房打卡#】@雷军发文称：6月7日，周六。健-20250607080557

昨天

新浪科技 · 【#王自如谈离开格力#：正当想把最新AI技术融入到构想中时，终场-20250606173252

昨天

新浪科技 · 【#科学家称宇宙是黑洞套娃#】#宇宙真的始于大爆炸吗#？几十年来-20250606115001

2 天前

新浪科技 · 【#父亲游戏氪金谎称孩子所为要求退款#，法院驳回其诉讼请求并罚款-20250605211023

2 天前

微路况 · 福利来袭！爆款行车记录仪降价秒杀

8 年前

潘幸知 · 一个34岁的二孩女人写给丈夫的信

8 年前

中国政府网 · 中国总理把一场午宴变成思想盛宴

8 年前

参考消息 · 关注 | 外媒：特朗普推进对华天然气出口且“中国的待遇不能低”

7 年前

果壳 · 有人用算法买到了房子？还有这种操作？？

7 年前