|
Gemini 真正意义的屠榜啊!真的属于Google 的高光时刻,暴打各个小朋友。 我都说了,只要谷歌不开发布会,就一定会成功。 没有 Debuff 的谷歌这次简直超模了! 不是只能拿这么多榜单,而是榜单只有这么多,如果满分不是 10 分,谷歌可以拿 1000 分! 关键aistudio还是可以免费使用,真的如果你还在勉强付费,非常用 AI 用户,赶紧直接上aistudio把。 接下来让大家感受下,来自谷歌屠榜的压力!!感谢Daniel同学的素材!以及手工测试的朋友。
遥遥领先GPT 5.1、Claude 4.5,部分指标几十倍提升!尤其是数学
 综合排名跃迁第一!  DeepThink 更强!可惜只有 Ultra 用户才可以使用,各位白嫖学生们,我们不可以的。 SimpleQA Verified 第一
Humanity's Last Exam人类最后的尊严,领先50% 以上
 Arena竞技场 第一  ARC-AGI-2 LEADERBOARDAGI 遥遥领先,什么叫又便宜又好用?  不知名的...凑个数冷静下  大模型时局图憋了几个月,来了个大招,而不是大,什么叫卧薪藏胆!  Vending-Bench 2: Average over 5 runs per model  Box Al Enterprise Eval for Gemini 3 (Advanced Reasoning)化身行业专家咔咔咔咔一顿乱X。  Vibe一个谁说不行 Extended Word Connections: Scoreboard (759 puzzles)
 设计天赋拉满  LisanBench  Chain Length Distribution by Word 
|