Codex 这可以看作是 OpenAI 版的 Claude Code,然后还有独立的 WebUI升级后的 Codex 速度更快、更可靠,在实时协作和独立处理任务方面表现更出色。无论是在终端、IDE、网页,甚至手机上,它都能大显身手
https://chatgpt.com/codexAgent" data-itemshowtype="0" linktype="text" data-linktype="2">Codex 实测:OpenAI 的云端 Coding AgentGPT-5-Codex 是 GPT-5 的一个特殊版本,专门针对 Codex 中的代理式编程进行了优化。它专注于处理真实的软件工程工作,比如从零开始构建项目、添加功能和测试、调试、大规模重构以及代码审查。它的可控性更强,能更好地遵循指令,生成的代码质量也更高
在代码重构任务上,GPT-5-Codex 的准确率(51.3%)远超标准版 GPT-5(33.9%),在 SWE-bench 验证集上有所提升
GPT-5-Codex 能根据任务复杂性动态调整“思考”时间。处理小请求时反应更快,而对于大型重构等复杂任务,则会投入更长时间,测试中甚至能独立工作超过7小时
GPT-5-Codex 经过专门训练,能有效发现代码中的关键缺陷。它不仅能理解 PR 的意图,还能分析整个代码库和依赖关系,以及执行代码和测试来验证行为。在评估中,它的错误评论率仅为 4.4%(GPT-5 为 13.7%),而高影响力评论占比则达到了 52.4%(GPT-5 为 39.4%)
它在前端任务上也同样可靠,能处理你提供的图片或截图作为输入,并在工作中向你展示截图,迭代改进
- Codex CLI:工作流整个重构了,现在支持在命令行中附加图片(截图、线框图等),还带有to-dolist、联网搜索等工具
- Codex IDE 扩展:将 Codex 代理带入 VS Code、Cursor 等编辑器中,可以无缝预览本地更改,并利用打开的文件等上下文信息,让提示更简短,响应更快
- Codex Cloud:基础设施性能大幅提升,任务完成时间中位数缩短了 90%,能自动设置环境、安装依赖,还能在云端浏览器中工作并截图反馈
- 代码审查功能:开启后,Codex 会自动审查 GitHub 仓库的 PR。你也可以通过 `@codex review` 手动触发,甚至给出具体指令,如“审查安全漏洞”
“我需要为发布一个功能而更新另一个团队的代码库。有了 Codex,我把重构和测试生成的工作交给了它,自己则专注于其他优先事项。它生成了高质量、经过充分测试的代码,让我能快速交接——保证了功能按时上线,且没有增加风险。”
— Tres Wong-Godfrey, Tech Lead at Cisco Meraki
Codex 的构建以安全为核心。默认情况下,它在禁用了网络访问的沙盒环境中运行。在执行潜在危险操作前会请求许可,开发者可以根据风险承受能力自定义安全设置。当然,官方始终鼓励开发者在使用前审查代理的工作
Codex 已包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 会员用量中。Business 和 Enterprise 可以购买额度,GPT-5-Codex 也计划很快在 API 中提供。