返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 12px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);visibility: visible;">专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;visibility: visible;">应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。


Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。


此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理


o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。


o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输。开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。


在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。


在美国数学竞赛(AIME 2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。


在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;


在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7 秒,比 o1-mini的10.16秒快了24%


在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?


感谢新增网络搜索功能,非常喜欢这个。


功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1 作为模型,类似于 Perplexity AI。谢谢!


虽然不支持视觉功能,o3仍然遛的起飞。


在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。


o3-mini高推理模式,Plus用户每周只有50条消息?


到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ