|
你敢信?一家小型初创公司竟然凭借 700 亿参数的模型,直接在部分测试中超过了 Open o1,妥妥地在 AI 江湖里“秀”了一把! ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
来,一起看看这个小公司是怎么“以小博大”,在巨头环伺的领域里逆风翻盘的!
谁是这位深藏不露的高手? 这家初创公司名叫 Nous Research(诺斯研究院),虽然规模不大,但在开源社区早就小有名气。 ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
2023 年到 2024 年期间,他们发布的开源微调模型可以说是"一鸣惊人",在圈内收获了不少真金白银的口碑。 这次他们又整出了个大活 —— Forge Reasoning Engine(锻造推理引擎)。 那么,Forge 引擎有何“神通”? Nous Research 并没有靠堆硬件、加参数,而是聪明地给 Hermes 70B 装上了“技术外挂”,在推理过程中让 AI 动脑“思考”。 具体来说,Forge 引擎的秘密武器有三大件: ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.034em;text-align: center;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
1. 蒙特卡洛树搜索 (Monte Carlo Tree Search) 这种算法一般用于下棋和游戏AI,能帮助AI在复杂问题中寻找最佳路径。就是下围棋那位 AlphaGo 用的绝招! 2. 链式代码生成 (Chain of Code) 类似于代码执行链条,让AI能够像人类思考过程一样逐步推理,逐步构建答案。 3. 混合智能体 (Mixture of Agents) 相当于在AI大脑里分配多个“角色”,不同智能体互相协作,从而输出更复杂、更有深度的回答。 这三项技术组合在一起,使得Hermes 70B能够在推理时“更走心”,以极为复杂的思维结构解决问题,让小模型也能达到大模型的效果。 甚至在美国数学邀请赛考试中赢过了 o1!要知道这可是数学界的"高考"啊! Forge的“推理”是如何运作的? Forge的核心亮点在于其推理过程中的时间扩展(inference time scaling)。 通常模型的计算资源越多,推理速度越快,但Forge引擎让推理时间可调,通过延长推理时间提升Hermes 70B的理解和分析能力。 ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
即使参数规模不及OpenAI的o1,Forge也能通过“花时间思考”来拉近与大模型的差距。 尤其是对于GPU资源有限的小公司或个人开发者,Forge简直是救星,不必苦恼于模型的巨大算力需求,用更多推理时间就能达到大模型的部分效果。 更神奇的还在后面 Forge 的另一大亮点在于它的通用性,不仅适用于 Hermes 70B,还可以配合不同模型使用。 任何公司都可以用 Forge 给自家模型升级推理能力,相当于让“千元机”也能跑出“旗舰机”水平。 低算力机器只要愿意多“思考”一下,也能接近大模型的效果。 这对资源不足的小公司来说,简直是“平权运动”啊! 目前仅开放给小范围测试用户 目前,Forge Reasoning Engine仍处于封闭测试阶段,仅对小范围的开发者和社区成员开放API使用权限。 Nous正在通过这波测试收集用户反馈,以进一步优化引擎,让其能够在各类场景下表现更出色。 如果你对该项目感兴趣,可以在Nous Research官网申请测试资格。 700亿参数模型VS超大模型:一场理性与资源的对抗 Nous的小规模团队用700亿参数挑战业界巨头,不仅是模型设计的胜利,更是思维方式的突破。 ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>
这无疑是对那些 GPU 资源不多的开发者的一种启发——AI模型的规模不再决定一切,只要推理结构足够精妙,哪怕小型模型也能在复杂推理任务中一展身手。 记住:在 AI 的世界里,除了拼爹拼钱以外,还可以拼智慧! 申请内测地址:nousresearch.typeform.com/FORGEAPI?typeform-source=forge.nousresearch.com来源:nousresearch.com/introducing-the-forge-reasoning-api-beta-and-nous-chat-an-evolution-in-llm-inference- End - |