链载Ai

标题: 重磅!OpenAI 开源 gpt-oss 大模型,性能卓越免费商用 [打印本页]

作者: 链载Ai    时间: 昨天 21:55
标题: 重磅!OpenAI 开源 gpt-oss 大模型,性能卓越免费商用

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(250, 81, 81);">简介

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 16px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">大陆时间 2025.8.6 凌晨 3 点左右,OpenAI 发布了ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">gpt-oss-120bingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 14.4px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">gpt-oss-20b两款性能卓越的轻量级语言模型。他们具备如下特点:

简单通过 Ollama 试用了下,效果看起来不错,但超过显示需要订阅。

模型架构

每个模型都是一个 Transformer,它利用专家混合 (MoE) 来减少处理输入所需的活跃参数数量。gpt-oss-120b 每个令牌激活 51 亿个参数,而 gpt-oss-20b 激活 36 亿个参数。

模型
层数
总参数
每个令牌激活参数
总专家数
每个令牌激活专家数
上下文长度
gpt-oss-120b
36
117b
5.1b
128
4
128k
gpt-oss-20b
24
21b
3.6b
32
4
128k

OpenAI 使用了一个高质量、主要为英文的纯文本数据集对模型进行了训练,重点关注STEM编程通用知识领域。使用了 OpenAI o4-mini 和 GPT‑4o 所用令牌化器的超集进行数据令牌化,即o200k_harmony,该令牌化器也一并开源,源代码地址为 https://github.com/openai/harmony

评估


gpt-oss-120b
gpt-oss-20b
OpenAI o3
OpenAI o34-mini
推理与知识




MMLU
90
85.3
93.4
93
GPQA 钻石级
80.9
74.2
77
81.4
人类终极测试
19
17.3
24.9
17.7
竞赛数学




AIME 2024
96.6
96
91.6
93.4
AIME 2025
97.9
98.7
88.9
92.7

gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini,并与 OpenAI o4-mini 持平或超越其性能。

此外,它在健康相关查询 (HealthBench⁠) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小,但在这些相同的评估中,它与 OpenAI o3‑mini 持平或超越后者,甚至在竞赛数学和医疗方面表现得更好。

可用性

原生量化为 MXFP4 格式,gpt-oss-120b 模型可在 80 GB 内存中运行,gpt-oss-20b 仅需 16GB 内存

gpt-oss-120b 面向生产可用场景,可部署在大型数据中心和高端设备上。

gpt-oss-20b 面向设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。

做了大量的优化工作

OpenAI 在设计 gpt-oss 时注重灵活性和易用性,与领先的部署平台合作:

在硬件方面,与 NVIDIA、AMD、Cerebras 和 Groq 合作确保在各类系统上实现性能优化。希望这些模型能够广泛地为开发者所用

总结

gpt-oss 虽然不是 OpenAI 最先进的模型,但是它汇聚了 OpenAI 内部前沿的技术理念、模型架构和训练方法。尤其是强大的智能体能力,支持工具调用、网页搜索、Python 代码调用等,给开发者提供了无限的可能

gpt-oss 有 2 个参数版本,20b 可在 16G 显存运行,适合普通消费者。120b 可以 80G 显存运行,适合生产环境。

OpenAI 系统 gpt-oss 在加速前沿研究,促进创新,并推动在广泛应用场景下实现更安全、更透明的 AI 开发







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5