链载Ai

标题: Google DeepMind正式推出Gemma 3:开源LLM的新标杆! [打印本页]

作者: 链载Ai    时间: 4 小时前
标题: Google DeepMind正式推出Gemma 3:开源LLM的新标杆!

今天和大家讲一下Google DeepMind刚刚发布的Gemma 3,这是他们开源语言模型系列的最新迭代版本。这次升级带来了许多显著的改进,包括多模态能力、更长的上下文长度以及增强的多语言性能。Gemma 3的模型规模从10亿到270亿参数不等,专为在消费级硬件上高效部署而设计,同时还能提供行业领先的表现。更重要的是,它在LMArena排行榜的人类偏好评估中,超越了Llama3-405B、DeepSeek-V3和o3-mini等知名模型。

话不多说,我们一起来看看Gemma 3到底有哪些亮点吧!

Gemma 3的关键特性 ?

1. 多模态能力:视觉理解来了!

我们都知道现在AI模型的能力越来越“全能”了,而Gemma 3最大的升级之一就是加入了视觉理解功能。与之前的版本不同,Gemma 3可以通过一个自定义的SigLIP视觉编码器来处理图像。这个编码器会将图像转换成固定大小的向量表示,然后语言模型将其作为“软标记”进行解释。

当然,如果你经常用LLM做纯文本任务的话,这里视觉部分可能暂时用不上了,就暂不介绍了。

2. 超长上下文:支持高达128K Tokens

Gemma 3在上下文长度方面也有了质的飞跃,最高支持128,000个tokens(1B模型除外,支持32K tokens)。要知道,处理这么长的上下文可不是件容易的事,需要一系列架构上的优化:

这些优化让Gemma 3在处理超长文档时更加得心应手。

3. 架构与效率改进

为了进一步提升性能,Gemma 3引入了一系列新特性:

如果你对写代码或模型优化感兴趣的话,这些技术细节绝对值得深入研究!

4. 增强的多语言支持

Gemma 3在多语言处理方面也有了显著提升,这得益于重新调整的训练数据组合和采用的Gemini 2.0分词器

对于那些希望在全球化场景中应用LLM的人来说,Gemma 3无疑是一个强有力的选择。

5. 指令微调模型(IT):SOTA性能

Gemma 3的指令微调(IT)模型经过了一个高级后训练流水线,结合了知识蒸馏、强化学习(RLHF)和数据集过滤等技术。

性能基准 ?

Gemma 3在多个AI基准测试中都取得了令人印象深刻的成绩:

基准测试
Gemma 3 27B
Gemma 2 27B
提升幅度
MMLU-Pro67.5%
56.9%
✅ +10.6%
LiveCodeBench29.7%
20.4%
✅ +9.3%
Bird-SQL (dev)54.4%
46.7%
✅ +7.7%
FACTS Grounding74.9%
62.4%
✅ +12.5%

LMSYS Chatbot Arena排名 ?

Gemma3-27B-IT在全球LMSYS Chatbot Arena中排名第9,获得了1338的Elo评分,超过了以下模型:

Benchmark image






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5