链载Ai

标题: o1圈杀疯了,阿里又开源Marco-o1 [打印本页]

作者: 链载Ai    时间: 昨天 11:52
标题: o1圈杀疯了,阿里又开源Marco-o1
自OpenAI o1发布后引发了大型推理模型(LRM)研究热潮,这不,阿里又开源了Marco-o1
Marco-o1更加重视开放式问题的解决,目标是解决这个问题:“o1模型能否有效地推广到缺乏明确标准且奖励难以量化的更广泛领域?”
Marco-o1由链式思考(CoT)微调、蒙特卡洛树搜索(MCTS)、反射机制和创新的推理策略驱动——针对复杂的现实世界问题任务进行了优化。

经典的草莓(strawberry)问题,轻松拿下

在MGSM上Marco-o1准确性得到了提升

通过MCTS扩展解决方案空间

将蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)与大型语言模型(LLMs)集成,以增强Marco-o1模型的推理能力:

Marco-o1整体框架

    ingFang SC", miui, "Hiragino Sans GB", "Microsoft Yahei", sans-serif;letter-spacing: 0.5px;text-align: start;background-color: rgb(49, 49, 58);" class="list-paddingleft-2">
  1. MCTS框架中的节点和动作:






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5