链载Ai

标题: OpenAI揭秘,端到端训练是AI Agent的未来! [打印本页]

作者: 链载Ai    时间: 6 小时前
标题: OpenAI揭秘,端到端训练是AI Agent的未来!


最近,OpenAI的DeepResearch产品还是非常受欢迎的,而且从群友们反馈,效果也是别的Deep Research产品不能比的。 (另外预告一下,下周会给家人们分享一个0基础,0成本构建类deep research产品;后续还会分享如何用R1的GRPO微调Agent实战。 最近在玩这块,获得了一些蛮不错的结果~)

回到今天的内容,今天推文分享的是,OpenAI Deep Research团队产品负责人Isa Fulford和Josh Tobin的最新播客采访,能接受英文播客的同学们,可以去网络上搜索 《OpenAI’s Deep Research Team on Why End-to-End Training is the Future of AI Agents》。

接下来是播客的笔记解读:

Deep Research:不只是另一个搜索工具

给不熟悉这块的同学介绍一下背景,Deep Research是OpenAI继Operator之后推出的第二款Agent产品。与普通的ChatGPT不同,它能够搜索网站,使用代码工具,创建全面的研究报告,快速完成需要人花费数小时才能完成的任务。

Josh Tobin在采访中表示:"Deep Research不仅仅是为了节省时间,而是让那些原本需要花费数小时甚至数天的任务变得可行,让用户能够在几分钟内获得他们所需的90%的信息。"

端到端训练:AI Agent的未来方向

Deep Research最核心的突破是端到端的训练方法。传统的Agent构建方式通常是构建一个操作图表,其中一些节点是语言模型,但整体逻辑由人类定义,也就是workflow(工作流)。而Deep Research采用了完全不同的方法。

Josh Tobin表示:"在这个领域,人们反复学到的一课是,我们认为自己能通过手写代码做得比模型更聪明,但实际上,随着领域的发展,模型往往能提出比人类更好的解决方案。"

到这里,感觉R1的训练方式是不是就突然涌入脑海了?

还是简单说下,传统工作流构建的局限性,常见的分为2大类,独立优化、难以应对复杂场景。

看完这几点,这似乎跟新能源厂商在吹的端到端智能驾驶一个样子~

Deep Research的技术原理

Deep Research由OpenAI的最先进推理模型o3微调而来,专门针对困难的浏览任务进行了训练。

技术核心:

  1. 高质量训练数据






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5