|
OpenAI 你是懂炒作的。 一个新功能,搞直播发布会就算了,你能提前 12 小时就开始预热。 还让大家定好闹钟?...  然后直播开始 2 小时前,再炒作一次。 恨不得号召全世界人都来关注。  网友 1:这些家伙真会炒作。 网友 2:OpenAI 有一整个炒作部门。每个人都由 Sama(Sam Altman,OpenAI CEO)亲自培训。 好家伙,怪不得这么能 “演”!  总而言之,OpenAI 发布新功能了。 这一次,是新版Codex—— 一个远程 AI 编程助手 (Remote Software Agent)。
01|Codex是什么?2025 年是 AI Agent 爆发之年。 和已经发布的能直接操作浏览器的 Operator、能搜索海量内容并生成详尽调研报告的 Deep Research 一样,这次的 Codex 本质上也是一个AI Agent(智能体)。 从这里你就能看出 Codex 和其他 AI 编程工具的差别:Cursor、Windsurf 相对而言还是一个集成了 AI 辅助编程功能的 IDE(集成开发环境,Integrated Development Environment),它们的核心是帮助你在本地编写和优化代码。 而 Codex 则不同 —— 它更像是一个具备“自主性”的编程伙伴。  Codex 有双重形态: 本地:Codex CLI,直接在你的本地终端运行。 云端:Codex 云代理,使用 OpenAI 云端的计算资源,能够同时处理多个任务,自动修复 Bug、重构代码、优化性能,甚至根据你的项目目标提出改进建议。
02|Codex 系统概述编程任务是非常依赖底层模型的。 Codex 的底层是Codex-1模型,它是 OpenAI 基于o3模型、专为软件工程优化的版本,并通过强化学习训练,使该模型具备高度贴近人类风格的代码编写能力。 基于云端的 Codex 能够直接读取、编辑代码文件,并可以执行多种任务,包括代码编写、回答代码库问题、查找并修复 bug、提交 Pull Request、测试等。 每个 Codex 的任务在独立的沙盒环境中运行,具备完全隔离的文件系统和计算资源,确保安全可靠(参考 Manus 的任务运行方式)。 
03|关于 Codex-1 模型作为一款专为软件工程设计的模型,Codex-1性能强劲。  在 SWE-Bench(软件工程基准测试)中的通过率表现始终优于其基础模型o3-high,且随着尝试次数增加,表现逐步提升。 在 OpenAI 内部的 SWE 任务测试中,Codex-1的表现同样优异,准确率达到了 75%,明显超越了其他模型:o1-high仅为 11%,o4-mini-high为 67%,o3-high为 70%。 值得注意的是,上面的测试是在没有任何 AGENTS.md 文件或自定义环境配置的情况下进行的。此外,测试中的Codex-1使用了 192K 上下文长度和中等“推理强度”,这也是用户在产品环境中实际可用的配置。
04|Codex 都能干什么?总结几个 Codex 的高频使用场景。
- Codex 能够根据你的需求编写新功能,修复 Bug,甚至在完成后自动提交代码。
- 自动运行测试,格式化代码,遇到测试失败时会尝试修复,直到测试通过。
- 你可以让 Codex 帮你快速理解一个代码库,解释各模块的结构,甚至识别潜在问题并提出改进建议。
- 如果你有特定的项目规范,只需在仓库中添加 AGENTS.md 文件,Codex 会按照你的规则进行任务。
- Codex 云代理支持同时运行多个任务,每个任务在独立的沙盒环境中互不干扰。
- 这意味着它可以同时修复多个 Bug、优化多个模块,甚至在不同分支上执行代码改进。
- Codex 每个任务都在独立的云端沙盒中运行,任务之间互不干扰。
- 它无法访问互联网,只能使用预加载的代码库和用户配置的依赖,确保任务安全。

05|Codex 怎么用?目前 Codex 已开始向ChatGPT Pro、Enterprise 和 Team用户陆续推送。 ChatGPT Plus 和 Edu 教育用户也将“很快”获得使用权限。  用户可以通过 ChatGPT 侧边栏访问 Codex,并在云端创建新任务。 价格方面,OpenAI 表示当前阶段为免费试用期(其实是项目还处于研究预览阶段,research preview),用户无需额外付费。 而后续将推出按需付费模式,允许购买额外的使用额度。 对于本地版 Codex CLI 专用的codex-mini-latest模型(轻量化版本),开发者已经可以在 Responses API 中体验。codex-mini-latestAPI 定价为每百万输入 tokens 1.5 美元,每百万输出 tokens 6 美元。
结语Codex 活是好活,就是太不 open 了!
|