专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
IT之家  ·  再也不怕刷屏,微信界面空前清爽 ·  2 天前  
亿欧网  ·  1000亿的反击,迭代了|大众反击三部曲I ·  2 天前  
51好读  ›  专栏  ›  DeepTech深科技

OpenAI发布Codex智能体,助力开发者告别重复性劳动

DeepTech深科技  · 公众号  · 科技媒体  · 2025-05-17 20:35

正文

请到「今天看啥」查看全文



图 | 已经有人开始设想 Codex 会给开发者带来怎样的改变(来源: X


Codex 在一个沙盒化的云端虚拟计算机中运行,通过与 GitHub 连接,可以预先加载代码仓库。


用户可以通过 ChatGPT 侧边栏访问 Codex,通过输入提示并点击 Code 按钮来安排新的编码任务,或者点击 Ask 按钮向 Codex 询问关于代码库的问题。


每个任务都会在一个隔离的、沙箱化的云端环境中运行,Codex 可以访问整个代码库,包括代码文件、文档和配置文件等,并拥有运行 shell 命令的权限。


这一机制让 Codex 能够具备“类开发者 ”的工作环境,从而实现从问题分析、代码修改,到测试运行、结果反馈的闭环。


图 | Codex 生成 Diff 并执行测试(来源:OpenAI)


Codex 收到任务后,会在后台执行一系列操作,包括查找相关代码、修改文件、运行测试套件,并在任务完成后将结果(包括代码 diff、终端输出、日志等)展示给用户。


整个过程是自动完成的,无需用户手动干预。根据任务复杂度,完成时间通常在 1 到 30 分钟之间,用户可以实时监控 Codex 的工作进度。


值得一提的是,为了更好地适应项目环境,用户还可以在代码仓库中添加一个名为 AGENTS.md 的文件,告诉 Codex 各种定制化指令,包括如何运行测试、哪类命名规范应遵循、有哪些依赖注意事项等,类似于工作指南。


Codex 能够同时执行多项软件工程任务,并且工作期间不会限制用户使用计算机和浏览器。但是,在任务执行期间,Codex 无法访问互联网,交互仅限于通过 GitHub 存储库明确提供的代码和用户通过设置脚本配置的预安装依赖项。


当遇到不确定性或测试失败时,Codex 会向用户反馈这些问题,并由用户做出决定。为了防止滥用,Codex 经过了特殊训练,可以识别并精确拒绝旨在开发恶意软件的请求。


OpenAI 内部技术团队已经开始将 Codex 作为常用工具。工程师们主要用它来执行重复的、范围明确的任务,如重构、重命名和编写测试。它同样适用于搭建新功能、连接组件、修复 bug 和起草文档。








请到「今天看啥」查看全文