链载Ai

标题: DeepSeek Prover-V2,这才是探索AGI 的正确姿势! [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: DeepSeek Prover-V2,这才是探索AGI 的正确姿势!

刚刚,DeepSeek 在 Hugging Face 低调挂出ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">DeepSeek-Prover-V2-671B模型仓库。
数学定理证明,也能被 AI“无痛”拿下了?!

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">r/accelerate - New Deepseek Model Released DeepSeek-Prover-V2-671B

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">Sam Altman:?

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">这不是常规升级,而是一款专为数学定理证明打造的新物种;官方定位就是“Prover”——证明者。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">671 B + MoE

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-size: 15px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">
关键指标
数据
总参数量
671 B(6710 亿)
架构
MoE,61 层 Transformer
隐藏维度
7 168
激活参数
≈ 37 B / token(稀疏激活)
上下文窗口
163 840 tokens
(≈80 万汉字)
权重格式
BF16 +FP8量化可选

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">稀疏 MoE 让它在“超大体型”与“可部署性”之间找到平衡——

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">真正吃满的参数只占 ~5.5 %,推理成本比同级 dense 模型低得多。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">“数学天赋”从何而来?

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.75px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;">Lean 4 生态深度绑定

模型直接在 Lean 4 形式化证明框架上对齐训练,让输出一步到位就是可验证证明脚本。

海量合成 + RL 双加持

先是使用 DeepSeek-Coder 系模型生成自然语言讲解 + Lean 代码注释,扩大高质量数学语料库;

然后再用RLPAF / RMaxTS等强化学习策略做“自我博弈”,搜索更多证明路径 。

超长上下文 + MLA 压显存

多头潜在注意力(MLA)一边把键值缓存压到极致,一边把上下文窗口拉到 16 万+,从而能将复杂定理也一次吞下。

miniF2F / ProofNet等数学基准据称再次刷新自家纪录(官方论文待放出)。

民间测试显示,利用 kTransformers + 减显存技巧,单张 RTX 4090 就能跑流畅,显存降 93%,吞吐提升 5.7×。

开源 & 商用策略

MIT 许可证:模型权重 + 代码全放出,可二创、可闭源部署,无附加条款 。

Hugging Face直接下载 163 个分片即可起飞,也可走 DeepSeek API / SambaNova 等各家厂商的云端API 使用。

如果你想本地化:

transformers+accelerate+cuda>=12.2,配 8×H100 或 4090 省流版,半天就能把你的教科书证明完。

由于 Prover-V2 在内部已有“证明链”,许多老派 chain-of-thought prompt 反而拖后腿。

社区开始实验“一句话任务描述即可”的新范式。

Lean 社区掀起“让 AI 带我做作业”挑战,PhD 候选人现场看模型把自己论文定理秒证,一脸复杂。

3 个姿势开玩

Lean 4 自动补全

VS Code +lean4-mode+ Prover-V2 后端,写一句sorry,模型给你整段证明。

Math Agent

让模型先把人类猜想翻译成 Lean 目标,再自己证明;Human 只负责提问与最终 sanity-check。

教材生成器

喂一本 PDF《高等代数》,让 Prover-V2 自动生成“分步形式化证明 + 中文讲解”,瞬间把老师变助教。

另外,有必要科普一下——

Lean 是什么?

  1. 把数学定理写成计算机能检查的“形式化证明”,再也不用担心证明里藏 bug;
  2. 写出带有“定理级”正确性保证的程序(证明即代码,代码即证明);
  3. 做元编程:用 Lean 给 Lean 本身写“宏”和自动化战术(tactic),让证明更省力。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5