|
2025年3月6日是个值得纪念的日子,阿里云通义千问官微宣布发布并开源最新的推理模型QwQ-32B。据介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。下面我们看看官方发布的内容截图:目前,QwQ-32B已在Hugging Face和ModelScope开源,并采用了Apache 2.0开源协议,预示着所有人都可以免费下载和商用。Hugging Face也更新了大模型排名,QwQ-32B也成功登顶:同时,QwQ-32B在数学、代码及通用能力上整体性能比肩DeepSeek-R1,并降低了部署使用成本,在消费级显卡上也能实现本地部署。 huggingface: https://huggingface.co/Qwen/QwQ-32B hf镜像站: http://hf-mirror.com/Qwen/QwQ-32B ollama: https://ollama.com/library/qwq 也可以使用ollama直接拉取该模型,命令如下: 相比较deepseek-r1 671b满血版,QwQ的资源占用极低!ollama平台q4量化版,仅占用20G显存,全量模型所需的显存也不超过80G即可实现流畅推理!另外,有小道消息说有DS相关人员提供技术支持哦! QwQ-32B发布后,影响感觉还是很大的,尤其是对之前花了很多上671B的客户们来说,可能会肉疼一段时间吧!现在AI大模型的更新迭代太快,自从DeepSeek开源后,的的确确是促进了整个大模型的跃进式迭代更新,期待这些头部企业能够给我们带来更多更好的技术吧! |