返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

都是通义千问,Qwen2-7B和Qwen1.5-14B怎么选

[复制链接]
链载Ai 显示全部楼层 发表于 6 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">最近有位粉丝提问,说他有个项目,开发的时候用的是Qwen1.5-32B模型,正在考虑给客户部署,但是客户的资源有限,可以部署14B的模型。他现在在纠结是给部署Qwen1.5-14B还是最新的Qwen2-7B。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">首先,选择Qwen2-7B还是Qwen1.5-14B主要取决于项目对模型性能的需求和应用场景。但从性能来看的话,我的观点是:虽然Qwen1.5-14B拥有更大的参数量,但Qwen2-7B的性能全方面优于Qwen1.5-14B。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">以上的结论并不是毫无根据的,通过对比阿里官方关于相同基准的模型评测,我们也可以得出以上的结论:

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 1em;list-style: circle;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  • • Base模型的评测:


Qwen2-7BQwen1.5-7BQwen1.5-14BQwen1.5-32B
MMLU70.361.067.673.4
BBH62.640.253.766.8
HumanEval51.236.037.837.2
GSM8K79.962.570.177.4
MATH44.220.329.236.1
C-Eval83.274.178.783.5
CMMLU83.973.177.682.3
    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;padding-left: 1em;list-style: circle;color: rgb(63, 63, 63);" class="list-paddingleft-1">
  • • Instruct指令微调(人类偏好对齐)评测:


Qwen2-7B-InstructQwen1.5-7B-ChatQwen1.5-14B-ChatQwen1.5-72B-Chat
MT-Bench8.417.607.918.61

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">注:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Qwen1.5沿用Base和Chat模型的分类,Chat模型又称聊天模型,是经过人类偏好对齐的版本,对齐的目的是增强语言的指令跟随能力,生成和人类偏好相近的回复。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Qwen2版本采用Base和Instruct的分类,Instruct为指令微调版本,同样是增强了模型的指令跟随能力和人类偏好。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">除了以上性能的提升外,在Qwen1.5系列中,只有32B和110B的模型使用了GQA。而Qwen2所有尺寸的模型都使用了GQA,以便让大家体验到GQA带来的推理加速和显存占用降低的优势。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">上下文长度方面,Qwen2所有的预训练模型均在32K tokens的数据上进行训练,Qwen2-7B-Instruct更是实现了长达128K tokens上下文长度的支持。

结论:

1、Qwen2-7B在多个评测中表现优异,超越了拥有140亿参数的Qwen1.5-14B,这表明Qwen2-7B在效率和性能之间取得了很好的平衡。

2、Qwen2-7B拥有GQA技术的加持,在推理加速和显存占用方面具备更大优势。

3、Qwen2-7B具备128K上下文长度,而Qwen1.5-14B仅有32K的上下文。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ