你敢信?一家小型初创公司竟然凭借 700 亿参数的模型,直接在部分测试中超过了 Open o1,妥妥地在 AI 江湖里“秀”了一把!
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
来,一起看看这个小公司是怎么“以小博大”,在巨头环伺的领域里逆风翻盘的!
谁是这位深藏不露的高手?
这家初创公司名叫 Nous Research(诺斯研究院),虽然规模不大,但在开源社区早就小有名气。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
2023 年到 2024 年期间,他们发布的开源微调模型可以说是"一鸣惊人",在圈内收获了不少真金白银的口碑。
这次他们又整出了个大活 —— Forge Reasoning Engine(锻造推理引擎)。
那么,Forge 引擎有何“神通”?
Nous Research 并没有靠堆硬件、加参数,而是聪明地给 Hermes 70B 装上了“技术外挂”,在推理过程中让 AI 动脑“思考”。
具体来说,Forge 引擎的秘密武器有三大件:
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.034em;text-align: center;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
1. 蒙特卡洛树搜索 (Monte Carlo Tree Search)
这种算法一般用于下棋和游戏AI,能帮助AI在复杂问题中寻找最佳路径。就是下围棋那位 AlphaGo 用的绝招!
2. 链式代码生成 (Chain of Code)
类似于代码执行链条,让AI能够像人类思考过程一样逐步推理,逐步构建答案。
3. 混合智能体 (Mixture of Agents)
相当于在AI大脑里分配多个“角色”,不同智能体互相协作,从而输出更复杂、更有深度的回答。
这三项技术组合在一起,使得Hermes 70B能够在推理时“更走心”,以极为复杂的思维结构解决问题,让小模型也能达到大模型的效果。
甚至在美国数学邀请赛考试中赢过了 o1!要知道这可是数学界的"高考"啊!
Forge的“推理”是如何运作的?
Forge的核心亮点在于其推理过程中的时间扩展(inference time scaling)。
通常模型的计算资源越多,推理速度越快,但Forge引擎让推理时间可调,通过延长推理时间提升Hermes 70B的理解和分析能力。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
即使参数规模不及OpenAI的o1,Forge也能通过“花时间思考”来拉近与大模型的差距。
尤其是对于GPU资源有限的小公司或个人开发者,Forge简直是救星,不必苦恼于模型的巨大算力需求,用更多推理时间就能达到大模型的部分效果。
更神奇的还在后面
Forge 的另一大亮点在于它的通用性,不仅适用于 Hermes 70B,还可以配合不同模型使用。
任何公司都可以用 Forge 给自家模型升级推理能力,相当于让“千元机”也能跑出“旗舰机”水平。
低算力机器只要愿意多“思考”一下,也能接近大模型的效果。
这对资源不足的小公司来说,简直是“平权运动”啊!
目前仅开放给小范围测试用户
目前,Forge Reasoning Engine仍处于封闭测试阶段,仅对小范围的开发者和社区成员开放API使用权限。
Nous正在通过这波测试收集用户反馈,以进一步优化引擎,让其能够在各类场景下表现更出色。
如果你对该项目感兴趣,可以在Nous Research官网申请测试资格。
700亿参数模型VS超大模型:一场理性与资源的对抗
Nous的小规模团队用700亿参数挑战业界巨头,不仅是模型设计的胜利,更是思维方式的突破。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
这无疑是对那些 GPU 资源不多的开发者的一种启发——AI模型的规模不再决定一切,只要推理结构足够精妙,哪怕小型模型也能在复杂推理任务中一展身手。
记住:在 AI 的世界里,除了拼爹拼钱以外,还可以拼智慧!
- End -
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |