专栏名称: 爱范儿
关注这个时代最好的产品。
目录
相关文章推荐
新浪科技  ·  【#岚图汽车CEO卢放称坚决反对无序价格战# ... ·  21 小时前  
新浪科技  ·  【#雷军第51次健身房打卡#】@雷军 ... ·  昨天  
51好读  ›  专栏  ›  爱范儿

刚刚,ChatGPT上线最强编程智能体

爱范儿  · 公众号  · 科技媒体  · 2025-05-17 09:08

正文

请到「今天看啥」查看全文


任务完成后,Codex 会输出一整套可追溯的执行结果,包括终端日志、测试记录等验证信息。你可以对修改结果进行审查、提出建议,甚至直接在 GitHub 上发起 PR,或者合并进本地项目。
借助项目中的 AGENTS.md 文件,用户还可自定义 Codex 的行为,让它更贴合具体项目的开发规范与测试标准。
Codex 的核心模型为 codex-1,这是 OpenAI o3 系列里专为软件工程微调过的版本。
基准测试结果显示,codex-1 在 SWE-Bench 的得分为 72.1%,纸面参数优于 Claude 3.7 以及 o3-high。
训练方式也很「实战」,通过在真实开发环境中进行强化学习训练,Codex 能够生成更符合人类编码风格和审查偏好的代码,严格按照指令执行,并不断运行测试,直到测试通过为止。
从今天开始,Codex 将向 ChatGPT Pro、Enterprise 和 Team 用户开放,而 Plus 和 Edu 用户的支持也将很快上线。
安全性方面,Codex 做得也够克制。执行任务时,它只会访问你提供的代码库和预设依赖,不能联网、不能访问外部 API,遇到不确定问题会停下来提示你处理。
并且,Codex 经过专门训练,能够识别并拒绝与恶意开发相关的请求,避免被滥用于开发恶意软件。
目前,OpenAI 已在内部广泛使用 Codex,协助工程师完成重构、命名规范、编写测试等重复性任务,显著提升开发效率。一些外部合作团队也给出了积极反馈,比如 Cisco 与 Temporal 借助 Codex 加快了开发与调试节奏。






请到「今天看啥」查看全文