返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

超级重磅!刚刚OpenAI发布全新推理模型o1系列,IMO正确率高达83%

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 16:16 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding-right: 0.2em;padding-left: 0.2em;color: rgb(255, 255, 255);background: rgb(15, 76, 129);">OpenAI放大招!全新推理模型o1系列来了,解题能力堪比博士生!

就在5分钟前,OpenAI发布了全新的 AI 模型系列——OpenAI o1,主打推理能力,号称能解决比以往模型更难的科学、编程和数学问题!

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">先别急着激动,这次只是预览版!OpenAI 表示,o1 系列模型还将进行定期更新和改进,后续还会加入更多功能,例如网页浏览、文件和图像上传等。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">那么,o1 系列模型到底有多牛呢?

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">推理能力大幅提升:OpenAI 表示,o1 模型在物理、化学和生物等学科的 challenging 基准测试中,表现与博士生相当

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.1em;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(15, 76, 129);">数学和编程能力爆表:在一项国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 的正确率只有 13%,而 o1 模型的正确率高达 83%!在 Codeforces 编程竞赛中,o1 模型的成绩也达到了前 89%!

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 8px;color: rgb(63, 63, 63);">o1 系列模型的工作原理:

更像人类一样思考:o1 系列模型经过训练,能够花更多时间思考问题,尝试不同的策略,并识别自己的错误,就像人类一样!

o1 系列模型的安全性:

全新安全训练方法:OpenAI 开发了一种新的安全训练方法,利用 o1 模型的推理能力,让它们更好地遵守安全和对齐准则

更强的“越狱”抵抗力:OpenAI 用“越狱”测试来衡量模型的安全性,结果显示 o1 模型比 GPT-4o 更不容易被“越狱”

o1 系列模型的应用场景:

科学研究:o1 模型可以帮助医疗研究人员分析细胞测序数据,帮助物理学家生成复杂的数学公式

编程开发:o1 模型可以帮助开发者构建和执行多步骤工作流程。

o1 系列模型的两个版本:

o1-preview:预览版模型,功能相对较少,但推理能力强大

o1-mini:更小、更快的推理模型,特别擅长编程,成本也更低

如何使用 OpenAI o1?

ChatGPT Plus 和 Team 用户:现在就可以在 ChatGPT 中使用 o1-preview 和 o1-mini 模型

ChatGPT Enterprise 和 Edu 用户:下周开始可以使用这两个模型

API 用户:符合条件的开发者现在就可以在 API 中使用这两个模型,但功能有限,例如不支持函数调用、流式传输、系统消息等

ChatGPT Free 用户:OpenAI 计划在未来向所有 ChatGPT Free 用户开放 o1-mini 模型

OpenAI 的未来计划:

继续改进 o1 系列模型,添加更多功能,例如网页浏览、文件和图像上传等

继续开发 GPT 系列模型,与 o1 系列模型并行发展

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ