超级重磅！刚刚OpenAI发布全新推理模型o1系列，IMO正确率高达83%

显示全部楼层

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding-right: 0.2em;padding-left: 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">OpenAI放大招！全新推理模型o1系列来了，解题能力堪比博士生！

就在5分钟前，OpenAI发布了全新的 AI 模型系列——OpenAI o1，主打推理能力，号称能解决比以往模型更难的科学、编程和数学问题！

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">先别急着激动，这次只是预览版！OpenAI 表示，o1 系列模型还将进行定期更新和改进，后续还会加入更多功能，例如网页浏览、文件和图像上传等。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">那么，o1 系列模型到底有多牛呢？

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">推理能力大幅提升：OpenAI 表示，o1 模型在物理、化学和生物等学科的 challenging 基准测试中，表现与博士生相当

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">数学和编程能力爆表：在一项国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o 的正确率只有 13%，而 o1 模型的正确率高达 83%！在 Codeforces 编程竞赛中，o1 模型的成绩也达到了前 89%！

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">o1 系列模型的工作原理：

更像人类一样思考：o1 系列模型经过训练，能够花更多时间思考问题，尝试不同的策略，并识别自己的错误，就像人类一样！

o1 系列模型的安全性：

全新安全训练方法：OpenAI 开发了一种新的安全训练方法，利用 o1 模型的推理能力，让它们更好地遵守安全和对齐准则

更强的“越狱”抵抗力：OpenAI 用“越狱”测试来衡量模型的安全性，结果显示 o1 模型比 GPT-4o 更不容易被“越狱”

o1 系列模型的应用场景：

科学研究：o1 模型可以帮助医疗研究人员分析细胞测序数据，帮助物理学家生成复杂的数学公式

编程开发：o1 模型可以帮助开发者构建和执行多步骤工作流程。

o1 系列模型的两个版本：

o1-preview：预览版模型，功能相对较少，但推理能力强大

o1-mini：更小、更快的推理模型，特别擅长编程，成本也更低

如何使用 OpenAI o1？

ChatGPT Plus 和 Team 用户：现在就可以在 ChatGPT 中使用 o1-preview 和 o1-mini 模型

ChatGPT Enterprise 和 Edu 用户：下周开始可以使用这两个模型

API 用户：符合条件的开发者现在就可以在 API 中使用这两个模型，但功能有限，例如不支持函数调用、流式传输、系统消息等

ChatGPT Free 用户：OpenAI 计划在未来向所有 ChatGPT Free 用户开放 o1-mini 模型

OpenAI 的未来计划：

继续改进 o1 系列模型，添加更多功能，例如网页浏览、文件和图像上传等

继续开发 GPT 系列模型，与 o1 系列模型并行发展