|
清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然发出刺耳的蜂鸣。 迷蒙中伸手摸索着关闭闹钟,一道冷光却猝然刺破昏暗——屏上跳出的消息写着:“o3-mini 来了”。 瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡,我猛地从床上坐起,连拖鞋都来不及穿就冲向了电脑。 今天,OpenAI 发布了两个版本:o3-mini 和 o3-mini-high。 
o3-mini 系列:小型推理模型的全新进化 o3-mini 是 OpenAI 推理模型系列的最新力作。 根据官方介绍,这款模型不仅是“轻量级”的代表,更代表了小型 AI 推理模型的一次全面进化: 这款模型在高效推理能力和高效运算处理之间找到了完美的平衡,特别在 STEM(科学、技术、工程、数学) 任务中表现尤为突出。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
这次的发布,不仅仅是技术上的一次进步,更是重新定义传统推理模型的边界。 或许是被DeepSeek卷到了,这是OpenAI首次向用户免费推出的推理模型。 同时还支持实时搜索功能,并获得相关网页链接,使得回答更丰富、实时。 OpenAI 提到,这虽然目前还处于原型阶段,但他们正在努力将搜索功能深入整合到推理模型中,以便为用户提供更加精准和实时的反馈。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;width: 100%;height: auto;"/>
免费用户可以通过选择“搜索+推理”来使用体验o3-mini。 实战体验:从“降智”疑虑到真实表现
第一次上手,画风是这样的。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;text-align: center;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
我大吃一惊,不至于这么拉胯吧,这是事实吗? 而且这输出的速度也太快了吧,并且没有思考的过程,这里面一定有猫腻。 当我换成电脑,重新测试之后,我发现正常运行的 o3-mini-high 模型,是有思考过程的,而且是全英文,内容如下: ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;text-align: center;width: 100%;height: auto;"/>
而最终的输出的结果,还是中文(下图所示),干净利落。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;width: 100%;height: auto;"/>
那为什么会出现这样的情况? 这让我联想到所谓的 “降智” 问题,也许以后有机会专门开篇讨论这个话题。 另外一个测试,经典问题: “今天买了三个苹果,我昨天吃了一个,我还有几个呢?” ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;text-align: center;width: 100%;height: auto;"/>
这一常见问题,许多模型回答失误,而 o3-mini 则毫无问题地给出正确答案。 接下来的网友测试进一步印证 o3-mini 的强大。 o3-mini 可能是最适合现实物理学的大语言模型。 Prompt: "write a python script of a ball bouncing inside a tesseract" 在另一个测试中,o3-mini 同样表现突出: Prompt: “Write a p5.js script that simulates 100 colorful balls bouncing inside a sphere. Each ball should leave behind a fading trail showing its recent path. The container sphere should rotate slowly. Make sure to implement proper collision detection so the balls stay within the sphere.”
o3-mini 不仅输出精准、迅速,还能准确把握物理法则,完美实现编程与物理模拟的结合。 看一下与DeepSeek-R1对比的测试 Prompt: "write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically"
可以看到,o3-mini的效果更接近实际需求。
接下来,我们来看一下 o3-mini high 在性能、速度和价格上的综合表现,简直让所有竞争对手无地自容。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
从图中可以看到,o3-mini high 在 整体表现和编程速度上都遥遥领先。 定价情况 OpenAI 的 o3-mini 定价在不同用户类型和 API 使用下有所不同。 对于 ChatGPT 用户,免费用户只能有限访问 o3-mini(通过选择 “推理”),而 Plus/Team 用户 可享有每日 150 条消息的访问权限,Pro 用户 则可以支付每月 200 美元 获得 无限制访问。 对于 API 用户,定价如下: ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
与之相比,DeepSeek-R1 的定价显然更具竞争力,输入和输出的费用分别为 0.14 美元 和 0.55 美元,远低于 o3-mini 的收费。 两个月前,强大的推理模型仅通过订阅提供,现如今,无论是 DeepSeek-R1 还是 ChatGPT(o3-mini),都可以免费体验这种强大推理能力。 对于大部分用户和开发者来说,无疑降低了进入门槛,使更多的人能够享受到 AI 推理的强大力量。 当然,o3-mini high 和 o1-pro 等最强模型依然需要付费。 不管怎么样,这对用户来说都是好消息。 另外,在发布会结束后的 Reddit “有问必答”活动中,Sam Altman 也透露出一些行业策略变化: “我们将比往年保持的领先优势更小” “重新思考开源策略” ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
这两点无疑进一步表明在 DeepSeek 带来的冲击下,OpenAI 正在积极调整战略,以适应新一轮的技术变革。 说到最后,重点在这 从清晨惊醒开始,到深入体验 o3-mini 及 o3-mini-high 的表现,我切身体会到这次发布为 AI 推理领域带来的颠覆性改变。 ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0px 0px 0.5em 0px;width: 100%;height: auto;"/>
|