|
今天凌晨OpenAI第三届开发者大会DevDay 2025上,OpenAI并未发布AI硬件,在现场官宣了ChatGPT可以直接在对话界面调用第三方APP,切入Agent领域并支持MCP,推出的官方套件称为AgentKit。首先,ChatGPT可以直接调用比如Spotify、Canva、Zillow、Booking.com、Expedia、Figma、Coursera等APP,通过语音或文本指令可以对这些APP进行操作,无需额外打开网页或者切换页面。OpenAI创始人奥特曼表示,“应用变现”方式也会在未来几周更新发布,这意味着ChatGPT不再仅仅是一个“聊天工具”,已经进化成为“操作系统”,未来用户可以在ChatGPT的聊天界面表达意图即可,接下来就完全交由AI驱动。另外是在Agent领域,现在大部分Agent落地顺利跑起来,从基础代码建设到连接外部工具等,还需要打通中间的诸多阻碍。而AgentKit是OpenAI平台上为开发者提供的构建、部署和优化Agent工作流程的一个套件,旨在帮助开发者将Agent从想法变成可执行工具。在大会现场官方还演示了如何在Agent Builder上搭建出自己的智能体,将编程和框架快速建好。然后在ChatKit里嵌入聊天工具,用户可以自己创造更多UI或品牌风格和想法。最后在Evals里进行“投入使用”检查可运行程度,用户可以评估各个节点的运行情况,并且获得对应的优化建议。也就是说,这个套件里已经包括了编程、设计、连接工具、运行测评等完整的链路。OpenAI的开发者也在现场使用这个套件在8分钟内建立了一个自己的Agent,并且可以直接将其部署到电脑使用的网站上。接下来,我们先回顾一下MCP,它支持大模型应用程序与外部数据源和工具之间的无缝集成。而AI+MCP可以让硬件实现AI自动查询资料、操控软件工具、多任务接力、记忆功能等一系列进阶的功能。在现场,OpenAI表示用GPT-5 Codex与实时API集成,可以接入任何MCP服务器中使用。并演示了要求Codex连接现场照明系统的MCP服务器,用语音指挥AI去控制摄像头和面灯,现场这一Demo演示确实精彩。而现场奥特曼介绍了GPT-5 Pro、Sora 2、GPT Realtime Mini等工具,将专业、视频、交互等功能的开发变得更加低门槛,现在唯一的限制变成了想象力。 |