链载Ai

标题: Qwen3 即将推出! [打印本页]

作者: 链载Ai    时间: 9 小时前
标题: Qwen3 即将推出!
最近在huggingface/transformers的 pr 中看到来自Qwen3Qwen3MoE的请求。

原文:https://github.com/huggingface/transformers/pull/36878


浏览代码可以看到这次的更新有:

看来本次针对更新的都是一些小参数的模型,比较期待有一个 30-40B 的 MoE


与传统 MoE 的差异

特性:


与 Qwen2.5 的比较

特性:


Qwen3Moe 的优势

特性:


总结

目前在小参数模型中,个人总体使用感觉来说,qwen模型是首选,特别是此次将要更新的Qwen3-15B-A2B,15B 总参数量的稀疏 MoE 模型,实际激活参数量为 2B,所以要求的硬件设备资源更低,速度可以更快






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5