链载Ai

标题: 这家小公司的700 亿参数模型竟然比Open o1还强? [打印本页]

作者: 链载Ai    时间: 昨天 11:50
标题: 这家小公司的700 亿参数模型竟然比Open o1还强?

你敢信?一家小型初创公司竟然凭借 700 亿参数的模型,直接在部分测试中超过了 Open o1,妥妥地在 AI 江湖里“秀”了一把!

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>

来,一起看看这个小公司是怎么“以小博大”,在巨头环伺的领域里逆风翻盘的!

谁是这位深藏不露的高手?

这家初创公司名叫 Nous Research(诺斯研究院),虽然规模不大,但在开源社区早就小有名气。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>

2023 年到 2024 年期间,他们发布的开源微调模型可以说是"一鸣惊人",在圈内收获了不少真金白银的口碑。

这次他们又整出了个大活 —— Forge Reasoning Engine(锻造推理引擎)。

那么,Forge 引擎有何“神通”?

Nous Research 并没有靠堆硬件、加参数,而是聪明地给 Hermes 70B 装上了“技术外挂”,在推理过程中让 AI 动脑“思考”。

具体来说,Forge 引擎的秘密武器有三大件:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.034em;text-align: center;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>

1. 蒙特卡洛树搜索 (Monte Carlo Tree Search)

这种算法一般用于下棋和游戏AI,能帮助AI在复杂问题中寻找最佳路径。就是下围棋那位 AlphaGo 用的绝招!

2. 链式代码生成 (Chain of Code)

类似于代码执行链条,让AI能够像人类思考过程一样逐步推理,逐步构建答案。

3. 混合智能体 (Mixture of Agents)

相当于在AI大脑里分配多个“角色”,不同智能体互相协作,从而输出更复杂、更有深度的回答。

这三项技术组合在一起,使得Hermes 70B能够在推理时“更走心”,以极为复杂的思维结构解决问题,让小模型也能达到大模型的效果。

甚至在美国数学邀请赛考试中赢过了 o1!要知道这可是数学界的"高考"啊!

Forge的“推理”是如何运作的?

Forge的核心亮点在于其推理过程中的时间扩展(inference time scaling)。

通常模型的计算资源越多,推理速度越快,但Forge引擎让推理时间可调,通过延长推理时间提升Hermes 70B的理解和分析能力。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>

即使参数规模不及OpenAI的o1,Forge也能通过“花时间思考”来拉近与大模型的差距。

尤其是对于GPU资源有限的小公司或个人开发者,Forge简直是救星,不必苦恼于模型的巨大算力需求,用更多推理时间就能达到大模型的部分效果。

更神奇的还在后面

Forge 的另一大亮点在于它的通用性,不仅适用于 Hermes 70B,还可以配合不同模型使用。

任何公司都可以用 Forge 给自家模型升级推理能力,相当于让“千元机”也能跑出“旗舰机”水平。

低算力机器只要愿意多“思考”一下,也能接近大模型的效果。

这对资源不足的小公司来说,简直是“平权运动”啊!

目前仅开放给小范围测试用户

目前,Forge Reasoning Engine仍处于封闭测试阶段,仅对小范围的开发者和社区成员开放API使用权限。

Nous正在通过这波测试收集用户反馈,以进一步优化引擎,让其能够在各类场景下表现更出色。

如果你对该项目感兴趣,可以在Nous Research官网申请测试资格。

700亿参数模型VS超大模型:一场理性与资源的对抗

Nous的小规模团队用700亿参数挑战业界巨头,不仅是模型设计的胜利,更是思维方式的突破。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;border-radius: 6px;box-shadow: rgb(210, 210, 210) 0em 0em 0.5em 0px;width: 100%;height: auto;"/>

这无疑是对那些 GPU 资源不多的开发者的一种启发——AI模型的规模不再决定一切,只要推理结构足够精妙,哪怕小型模型也能在复杂推理任务中一展身手。

记住:在 AI 的世界里,除了拼爹拼钱以外,还可以拼智慧!

申请内测地址:nousresearch.typeform.com/FORGEAPI?typeform-source=forge.nousresearch.com
来源:nousresearch.com/introducing-the-forge-reasoning-api-beta-and-nous-chat-an-evolution-in-llm-inference

- End -






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5