链载Ai

标题: 低于预期--OpenAI o1 [打印本页]

作者: 链载Ai    时间: 2025-12-2 11:30
标题: 低于预期--OpenAI o1

经过上次Sam预告后

2024年9月12 OpenAI推出 OpenAI o1系列模型

TL;DR

OpenAI o1

OpenAI o1 trained with reinforcement learning to perform complex reasoning. o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.

Evals

为了突出对 GPT-4o 的推理提升,我们在各种人类测试和 ML 基准测试中测试了我们的模型。我们表明,在绝大多数这些推理密集型任务中,o1 的性能明显优于 GPT-4o。

Chain of Thought

Coding

Human preference evaluation

How to use OpenAI o1

OpenAI o1-preview

目前在 ChatGPT 和 API 中发布了OpenAI o1系列的第一个preview版本,后续会继续更新和改进。

OpenAI o1-mini

Optimized for STEM Reasoning

o1-mini Model Speed

Next Step

从目前的观察来看,OpenAI有点苹果化,不同于刚开始在AI领域大刀阔斧的前进,近期发布的产品仍然低于预期,但是不可否认,目前GPT4系列的效果仍然超越同类其他产品。

但是OpenAI o1的发布,说明在探索推理方面可能开创一种新的范式,引导模型“System II thinking”

目前能看到的推测讨论都不太站得住,期待能看到更多的效果测评。







欢迎光临 链载Ai (http://www.lianzai.com/) Powered by Discuz! X3.5