2025年4月29日,阿里发布了Qwen3大模型,引起了国内外社交媒体广泛关注。这里,我们不妨从技术和应用两个角度讨论下Qwen3。
根据官方公布的Qwen3改进主要集中在以下几个方面:
小虾米评论:
从技术角度来看,QW3 并没有什么突破,更多的是在“炼丹”流程上的优化。然而,在应用层面,特别是开源的 MoE 模型在资源占用方面的优势,使得在个人电脑或边缘设备上离线使用接近当前主流模型能力成为可能。这对于企业级数据敏感场景以及端上离线应用具有巨大的潜力。
例如,Qwen3-30B-A3B 模型最低可以部署在 16GB 内存或 8GB 显存的机器上,主流个人电脑即装即用。而 Qwen3-235B-A22B 模型最低可以部署在 256GB 内存 + 24GB 显存的机器上。普通个人或企业只需花费数万元即可购买到符合该配置的设备。
另一方面,一些专业领域,如数学、推理、编程等,选择一些定制模型效果可能会更好。DeepSeek 在五一前发布的 DeepSeek-Prover-V2-671B即是一款数学定理证明的定制大模型。
对于大多数普通用户而言,当然选择满血版 Qwen3-235B-A22B 模型服务,又多了一个极低成本使用大模型的选择总是好的。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |