OpenAI 你是懂炒作的。
一个新功能,搞直播发布会就算了,你能提前 12 小时就开始预热。
还让大家定好闹钟?...
然后直播开始 2 小时前,再炒作一次。
恨不得号召全世界人都来关注。
网友 1:这些家伙真会炒作。
网友 2:OpenAI 有一整个炒作部门。每个人都由 Sama(Sam Altman,OpenAI CEO)亲自培训。
好家伙,怪不得这么能 “演”!
总而言之,OpenAI 发布新功能了。
这一次,是新版Codex—— 一个远程 AI 编程助手 (Remote Software Agent)。
2025 年是 AI Agent 爆发之年。
和已经发布的能直接操作浏览器的 Operator、能搜索海量内容并生成详尽调研报告的 Deep Research 一样,这次的 Codex 本质上也是一个AI Agent(智能体)。
从这里你就能看出 Codex 和其他 AI 编程工具的差别:Cursor、Windsurf 相对而言还是一个集成了 AI 辅助编程功能的 IDE(集成开发环境,Integrated Development Environment),它们的核心是帮助你在本地编写和优化代码。
而 Codex 则不同 —— 它更像是一个具备“自主性”的编程伙伴。
Codex 有双重形态:
本地:Codex CLI,直接在你的本地终端运行。
云端:Codex 云代理,使用 OpenAI 云端的计算资源,能够同时处理多个任务,自动修复 Bug、重构代码、优化性能,甚至根据你的项目目标提出改进建议。
编程任务是非常依赖底层模型的。
Codex 的底层是Codex-1模型,它是 OpenAI 基于o3模型、专为软件工程优化的版本,并通过强化学习训练,使该模型具备高度贴近人类风格的代码编写能力。
基于云端的 Codex 能够直接读取、编辑代码文件,并可以执行多种任务,包括代码编写、回答代码库问题、查找并修复 bug、提交 Pull Request、测试等。
每个 Codex 的任务在独立的沙盒环境中运行,具备完全隔离的文件系统和计算资源,确保安全可靠(参考 Manus 的任务运行方式)。
作为一款专为软件工程设计的模型,Codex-1性能强劲。
在 SWE-Bench(软件工程基准测试)中的通过率表现始终优于其基础模型o3-high,且随着尝试次数增加,表现逐步提升。
在 OpenAI 内部的 SWE 任务测试中,Codex-1的表现同样优异,准确率达到了 75%,明显超越了其他模型:o1-high仅为 11%,o4-mini-high为 67%,o3-high为 70%。
值得注意的是,上面的测试是在没有任何 AGENTS.md 文件或自定义环境配置的情况下进行的。此外,测试中的Codex-1使用了 192K 上下文长度和中等“推理强度”,这也是用户在产品环境中实际可用的配置。
总结几个 Codex 的高频使用场景。
自动化代码编写与调试:
代码库智能分析:
并行任务处理:
代码执行:
目前 Codex 已开始向ChatGPT Pro、Enterprise 和 Team用户陆续推送。
ChatGPT Plus 和 Edu 教育用户也将“很快”获得使用权限。
用户可以通过 ChatGPT 侧边栏访问 Codex,并在云端创建新任务。
价格方面,OpenAI 表示当前阶段为免费试用期(其实是项目还处于研究预览阶段,research preview),用户无需额外付费。
而后续将推出按需付费模式,允许购买额外的使用额度。
对于本地版 Codex CLI 专用的codex-mini-latest模型(轻量化版本),开发者已经可以在 Responses API 中体验。codex-mini-latestAPI 定价为每百万输入 tokens 1.5 美元,每百万输出 tokens 6 美元。
Codex 活是好活,就是太不 open 了!
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |