返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

阿里大模型QWQ-32B低成本部署(两分钟了解AI社区最新动态)

[复制链接]
链载Ai 显示全部楼层 发表于 2 小时前 |阅读模式 打印 上一主题 下一主题

近些年AI Agent井喷式发展,涌出一大批高性能的大模型,大大推动各行业发展和智能化水平发展。然而,性能优越的大模型往往具有庞大的参数量,想要部署到本地设备进行使用的话,对硬件性能要求较高,高性能的推理模型往往需要在高端的专业级显卡或者大规模的服务器集群上才能部署成功并进行使用,较高的使用成本和技术门槛使很多开发者和企业望而却步。

图片

ingFang SC";font-weight: bold;color: rgb(19, 18, 18);line-height: 22px;word-break: break-all;visibility: visible;">性能强大却难以部署的困局

图片

以满血版DeepSeek R1为例,其功能十分强大,但想要在GPU 上实现其满血版模型的部署可能要花费10万美元以上!如果采用CPU进行部署,需要24条32GB的内存条才能装得下,并且生成token的速度会很慢。Q4量化的版本DeepSeek R1-Q4_K_M,也得需要404GB空间,仍然很大,更何况Q8量化版本!

谷歌开发者专家、UCL计算机系博士生Xihan Li曾分享了部署Q4版本的过程,除了模型参数占用的内存+显存空间(404GB)以外,实际运行的时候还需额外预留一些空间用于上下文缓存,总计约500GB。在4×24GB显卡(RTX 4090)和4×96GB内存配置下,DeepSeek R1-Q4_K_M的短文本生成的速度只有约3token/秒,长文本生成时速度甚至会降到1token/秒。这样的速度显然难以应用到实际中。

图片

ingFang SC";font-weight: bold;color: rgb(19, 18, 18);line-height: 22px;word-break: break-all;visibility: visible;">小体量大模型带来福音!

图片

因此,小体量成为了阿里巴巴大模型QWQ-32B的最重要的亮点之一!QWQ-32B只有320亿参数量,和拥有6710亿参数(其中370亿参数被激活)的DeepSeek R1m模型相比,QWQ-32B的参数量只有其1/20!在部署方面,QWQ-32B和以往高性能推理大模型相比,QwQ-32B能够在消费级显卡上就能实现本地部署,满足快速响应和数据安全需求,这无疑是向众多开发者和企业送去福音。

图片

ingFang SC";font-weight: bold;color: rgb(19, 18, 18);line-height: 22px;word-break: break-all;visibility: visible;">QWQ-32B的三种部署方式

图片

比如,阿里巴巴在Hugging Face上开源的QwQ-32B版本,以Q4量化精度为例,只需占用不到20GB空间。除了4-bit量化的版本,Hugging Face上还有从2位、8位等不同版本,最小仅需不到13GB空间,将本地部署的难度直接拉到最低!普通的办公电脑都能运行得起来。本地部署成功后,加载与运行也是相当容易,十几行代码就能完成模型加载、处理问题并生成答案整个过程。
除了Hugging Face上开源的版本,Ollama也上线了Q4版本的QwQ-32B模型,安装Ollama后只需复制ollama run qwq到终端,即可体验。具体操作可参考我们以往发布的文章,链接在此:
https://mp.weixin.qq.com/s/5lhOsy_DGQiEK-yIx1QErA
此外,还可以通过“算了么”算力共享平台进行一键部署。只需进入“算了么”官网进行下载并安装,打开应用后在右上角应用商店下载对应模型即可,非常简便!“算了么”官网链接:https://suanleme.cn/

麻雀虽小,五脏俱全。QwQ-32B虽然体量轻便,但在与原始 DeepSeek-R1、DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini等模型的基准对比测试中,QwQ-32B表现优异!

QwQ-32B取得了小体量和高性能双重优势,这一模型的开源不仅代表着生成式大模型技术的又一次飞跃,更预示着“最强模型”走入个人设备时代的来临!让我们一起期待这一科技盛世早日惠及更多人!


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ