虽然Qwen1.5-14B拥有更大的参数量,但Qwen2-7B的性能全方面优于Qwen1.5-14B。ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">以上的结论并不是毫无根据的,通过对比阿里官方关于相同基准的模型评测,我们也可以得出以上的结论:• Base模型的评测:
| Qwen2-7B | Qwen1.5-7B | Qwen1.5-14B | Qwen1.5-32B | |
| MMLU | 70.3 | 61.0 | 67.6 | 73.4 |
| BBH | 62.6 | 40.2 | 53.7 | 66.8 |
| HumanEval | 51.2 | 36.0 | 37.8 | 37.2 |
| GSM8K | 79.9 | 62.5 | 70.1 | 77.4 |
| MATH | 44.2 | 20.3 | 29.2 | 36.1 |
| C-Eval | 83.2 | 74.1 | 78.7 | 83.5 |
| CMMLU | 83.9 | 73.1 | 77.6 | 82.3 |
• Instruct指令微调(人类偏好对齐)评测:
| Qwen2-7B-Instruct | Qwen1.5-7B-Chat | Qwen1.5-14B-Chat | Qwen1.5-72B-Chat | |
| MT-Bench | 8.41 | 7.60 | 7.91 | 8.61 |
1、Qwen2-7B在多个评测中表现优异,超越了拥有140亿参数的Qwen1.5-14B,这表明Qwen2-7B在效率和性能之间取得了很好的平衡。
2、Qwen2-7B拥有GQA技术的加持,在推理加速和显存占用方面具备更大优势。
3、Qwen2-7B具备128K上下文长度,而Qwen1.5-14B仅有32K的上下文。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |