返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

在笔记本上,部署 gpt-oss-120b 模型

[复制链接]
链载Ai 显示全部楼层 发表于 3 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(34, 34, 34);word-break: break-all;">今天 ,OpenAI 开源了俩模型:120B/20B

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(34, 34, 34);word-break: break-all;">117B 的ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 13.5px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">gpt-oss-120b对标 o4-min,按官方说法至少需要ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: inherit;color: rgb(58, 122, 246);">80G 内存,推荐使用单卡 H100 GPU

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(34, 34, 34);word-break: break-all;">而刚买的的游戏本,刚好满足ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 13.5px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">gpt-oss-120b的部署条件

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;color: rgb(63, 63, 63);">ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size:15px;margin:0.1em auto 0.5em;border-radius:8px;box-shadow:rgba(0, 0, 0, 0.1) 0px 4px 8px;width:100%;"/>

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;color: rgb(34, 34, 34);word-break: break-all;">这里面是ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 13.5px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">AMD395+ & 8060s(非常 YES),128G 统一内存
(说上面这些,就是来炫耀下我的本子)
(略略略~)

在测试后,发现部署 oss 并不需要 80G 显存,64G 就够了

以下是详细的部署
以及:并不需要 80G 显存,64G 就够了


部署工作

OpenAI 为gpt-oss系列模型,提供了完善的私有化部署支持,使用原生MXFP4量化,极大的降低了显存的使用

在工具层面,支持多种主流部署方法,包括:TransformersvLLMPyTorch / TritonOllamaLM Studio

这里,我用的是 LM Studio,可以在官网进行下载安装

进入 LM Studio 之后,可以直接搜索gpt-oss-120b并下载
模型较大,有几十个G,下载要一点时间


模型配置

模型下完后,还无法立即运行
虽说是统一内存,但默认分给显卡的,只有4G(剩下的全部算显存了)

明显不满足条件,需要手工修改一下内存分配
这里我把 64G 内存分配给了显存
(并不需要宣称的 80G)

完成后,点击 LM Studio 中的「载入模型」

模型顺利载入,显示部署成功


推理效果

OpenAI 这模型,可选多种推理强度,包括“低”、“中”、“高”

询问单词「strawberry」包含几个字母「r」:

低强度模式:约需10秒

高强度模式:耗时约1分钟

这个模型还支持更多的工具调用,比如可以自行配置 MCP


额外注意

在部署中,也有两个细节问题,分享如下:

Runtime 选择

LM Studio 提供了多种 Runtime 选项,包括 CUDA、Vulkan、ROCm llama.cpp、CPU llama.cpp 等

我使用的是 AMD 平台,显然无法使用 NVIDIA 的 CUDA 加速

理论上,ROCm更适合 AMD,但目前尚未支持 OpenAI 最新的gpt-oss系列模型

最终,我选择了Vulkan作为 runtime。这是一个跨平台的通用加速方案,且在最新版本的 LM Studio 中已经对 OpenAI 的 oss 做了适配

而 CPU llama.cpp 显然不是首选,毕竟这是 CPU 的

显存过高导致的问题

最开始的时候,我把显存分配拉高到 96GB,但这导致模型载入失败

仔细排查了下,发现模型载入过程本身还需要约 40G 的内存

所以,这里推荐将显存分配设为 64GB,能保证完美运行


总结

其一、OpenAI 的量化,是贴心的
其二、AMD,Yes!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ