返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

字节跳动整活了!正式发布 BFS-Prover,并全程开源!

[复制链接]
链载Ai 显示全部楼层 发表于 2 小时前 |阅读模式 打印 上一主题 下一主题


谁能想到,未来证明数学定理也能交给 AI 来完成?

字节跳动豆包团队最新推出的 BFS-Prover,不仅刷新了行业记录,还向全世界开放源码,邀请学术界和开发者共同探索。

一、BFS-Prover:数学证明领域的全新探索

数学证明一直是AI攻克的高难挑战。不同于围棋的固定规则,证明定理要求每一步都严谨无误,否则整个逻辑便会崩盘。

目前,主流自动定理证明技术大多依赖蒙特卡洛树搜索或价值函数,如DeepSeek-Prover-V1.5、HunyuanProver和InternLM2.5-StepProver,但它们普遍面临:

资源消耗巨大
复杂搜索策略耗费大量计算资源;
推理效率低下
需要反复试错才能找到正确路径;
适用性有限
不同数学问题往往需不同策略。

而 BFS-Prover则另辟蹊径,采用最优先树搜索(BFS),结合三大核心技术:

1. 专家迭代+自适应数据过滤
持续优化证明路径,降低无效搜索;
2. 直接偏好优化+Lean4反馈
让 AI 直接学会“好证明”的标准;
3. BFS与长度归一化结合
避免因证明步骤长短不一而偏离最优解。

二、成绩亮眼:MiniF2F 权威测试刷新记录


成绩是最有力的证明。BFS-Prover 在 MiniF2F 测试集上以72.95%的准确率轻松超越对手。

其它模型如 DeepSeek-Prover-V1.5、InternLM2.5-StepProver 和 HunyuanProver 分别为 63.5%、65.9% 和 68.4%。

它还成功解决了多个国际数学奥赛难题,如imo_1959_p1、imo_1962_p2,显示出AI在数学推理上的全新高度。

证明系统搜索方法Critic 模型策略预算准确率
BFS-Prover
BFS
Accumulative
72.95%
BFS-Prover
BFS
2048×2×600
70.83% ± 0.89%
HunyuanProver
BFS
600×8×400
68.4%
InternLM2.5-StepProver
BFS
256×32×600
65.9%
DeepSeek-Prover-V1.5
MCTS
32×16×400
63.5%


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ