返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

阿里刚刚开源Qwen3新思考模型:Agent能力超强,支持100万上下文

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 21:50 |阅读模式 打印 上一主题 下一主题

今天凌晨,阿里巴巴开源了Qwen3家族最新模型Qwen3-30B-A3B-Thinking-2507。


2507与之前阿里开源的Qwen3-30B-A3B-Thinking和Qwen3-235B-A22B-Thinking相比,在Agent智能体、AIME25数学、LiveCodeBench编程、GPQA解决复杂能力等方面,性能全部实现大幅度提升。


同时,2507也超过了谷歌的最新小参数模型Gemini-2.5-Flash-Thinking。


开源地址:https://huggingface.co/Qwen/Qwen3-30B-A3B-Thinking-2507


https://modelscope.cn/models/Qwen/Qwen3-30B-A3B-Thinking-2507


对于阿里的新模型,网友表示,疯狂优秀的本地模型,绝对是我能在20GB以内装下的最佳选择。思考模式真的带来了天壤之别,恭喜你们,太给力了!


对于这么小的一个模型而言,它在各方面的性能提升都令人印象深刻。


不错,性能很强。现在只需要融合多模态能力,并支持8小时的音频和视频转录等功能就更好了。


干得漂亮,各位。真难以想象完成这项工作付出了多少努力,那些不眠之夜和全神贯注的时刻。


Qwen团队的工作令人赞叹!Qwen3-30B-A3B-Thinking-2507模型在推理能力上的提升以及超大的上下文窗口具有颠覆性意义,为复杂问题的解决开辟了令人期待的新可能。期待探索它的潜力!


干的非常好,Qwen做的很棒。


Qwen3-30B-A3B-Thinking-2507总参数量达到305亿,其中激活的参数量为33亿,非嵌入参数量为299亿。该模型包含48层,采用Grouped Query Attention机制,Q的注意力头数为32,KV的注意力头数为4。


此外,它还具备128个专家,其中激活的专家数量为8。原生支持256K上下文,但通过扩展可增加至100万。


在性能方面,Qwen3-30B-A3B-Thinking-2507相比其他模型在多个任务上都有出色表现。例如,在知识类的MMLU-Pro任务中得分为80.9、MMLU-Redux为91.4、GPQA为73.4、SuperGPQA为56.8;在推理类的AIME25任务中得分为85.0、HMMT25为71.4、LiveBench 20241125为76.8;


在编码类的LiveCodeBench v6(25.02 - 25.05)任务中得分为66.0、CFEval为2044、OJBench为25.1;在对齐类的IFEval任务中得分为88.9、Arena-Hard v2为56.0、Creative Writing v3为84.4、WritingBench为85.0;

在Agent智能体类的BFCL - v3任务中得分为72.4、TAU1 - Retail为67.8、TAU1 - Airline为48.0、TAU2 - Retail为58.8、TAU2 - Airline为58.0、TAU2 - Telecom为26.3;


在多语言类的MultiIF任务中得分为76.4、MMLU-ProX为76.4、INCLUDE为74.4、PolyMATH为52.6。


Qwen3-30B-A3B-Thinking-2507在工具调用能力方面表现出色,推荐使用Qwen - Agent来充分发挥其代理能力,Qwen - Agent内部封装了工具调用模板和工具调用解析器,大大降低了编码复杂性。可以通过MCP配置文件、Qwen - Agent的集成工具或自行集成其他工具来定义可用工具。


为了达到最佳性能,建议采用这些设置:在采样参数方面,建议使用温度为0.6、TopP为0.95、TopK为20、MinP为0,对于支持的框架,还可以在0到2之间调整presence_penalty参数以减少无休止的重复,但使用较高值可能会偶尔导致语言混合和模型性能略有下降;


在输出长度方面,建议大多数查询使用32768个token的输出长度,对于高度复杂问题如数学和编程竞赛的基准测试,建议将最大输出长度设置为81920个token,为模型提供足够的空间来生成详细全面的回答,从而提升整体性能。


ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;color: rgb(34, 34, 34);background-color: rgb(255, 255, 255);line-height: 1.75em;text-align: center;">END

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ