Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

显示全部楼层

Qwen3以小博大

—

Qwen3明显发现自己当“AI界的汪峰”太久了，选了一个最平淡最没人关注的时间点发布了Qwen3。（当然这句话只限今天，只限现在，说不定今天DeepSeek R2就出来了?）

这次Qwen3最大的亮点就是：以小博大，Qwen3-4B直接干掉Qwen2.5-72B-Instruct，这牛也不是我吹的，官吹如下：

给人的感觉Qwen3是准备要换赛道了。

一是Qwen（汪峰）一出新品发布就被同行压着打；二是说实话，就我个人而言硬是找不到一星半点用它的理由，过去几个月使用频率也接近于0。之前还配合本地配置Ollama使用的，后来出了Google Gemma后就再没动过。

二是很少见大模型团队出这么小规模参数的Qwen3现在推这种小模型，极可能走硬件嵌入式道路，按4B这种小体格，各类低端的硬件随便跑。

以下是Qwen3模型发布的整理摘要：

模型列表

MoE架构模型

Qwen3-235B-A22B，顶尖模型应该是没有开源的。

总参数量：235B
激活参数：22B
上下文长度：128K
Qwen3-30B-A3B

总参数量：30B
激活参数：3B
上下文长度：128K

非MoE架构模型

关键新特性混合思维模式，可以手动开启关闭了，Qwen3新增thinking手动开关，支持用户控制思维链的显式开启/关闭。

这个功能虽然看起来不太起眼，但却是我个人觉得最为重要的一个功能，因为真的没有必要出现在所有的场景下都使用思考链。

就好比以前我吐槽微信搜索加入R1，问个天气还需要深度思考几秒钟。其实原本就只是请求一个接口就可以得到正确答案的事情。纯粹是为了蹭流量的硬加。

另外就是专门针对MCP强化编码和Agent任务表现，优化对MCP（多轮协作规划）的支持。

官方Demo已上线：http://chat.qwen.ai

测评排名和指标就不讲了，没有意义。

具体的实际体验报告，请关注微信公众号文章的后续推送。

—

不过这LOGO说实话我个人感觉真没老的醒目好看。

过去几周，Windsurf也简化了定价体系，为所有用户免费开放了GPT-4.1和o4-mini等尖端模型的使用权限（微信公众号后台回复Windsurf可看）。

今天，他们再次突破——对免费计划进行全方位升级。

免费用户现在享有 25次高级模型额度（原5次），配合GPT-4.1/o4-mini的0.25积分特惠价，相当于每月100次调用。

最大亮点：Cascade Base模型无限畅用，Write下的完整智能体体验。这一条同样适用于VSCode和JB系列。

无限制极速Tab补全，包含自动补全/超级补全/Tab跳转等付费级功能

另外还增加了应用部署权限：每日1次完整部署 + 无限次预览。