|
OpenAI 刚刚结束了自己一年一度的开发者大会。发布了一些东西,但我自己觉得值得看的点可能不是特别多 ==OpenAI 更新了好几个模型的 API版本,有GPT-5 Pro、GPT-realtime-mini、gpt-image-mini还有它们之前推出的视频生成模型S。GPT-5 Pro 是之前 Pro订阅会员的独享,一直没有放 API,现在终于有了,但是价格巨贵。每百万输入token,价格15刀; 每百万输出 token,价格120刀。再加上400k的上下文窗口,配上272k的最大输出。尽管如此,还是推荐一试。根据我自己的使用体验,可以粗暴地下一个结论就是:抛开速度慢这个影响使用体验的因素来说,GPT-5 Pro比几乎市面上所有的其他模型都表现得更加聪明和智能。 再来看下gpt-realtime-mini这个模型。gpt-realtime-mini 可以认为是 gpt-realtime 的更省钱版本,响应速度会更快。每百万输入的价格是0.6刀,每百万输出的价格是2.4刀。与之对比的是gpt-realtime,每百万输入的价格是4刀,每百万输出的价格是16刀。还有一个省钱版本的 gpt-image-1,叫 gpt-image-1-mini。但,经过了 Nano Banana 还有Seedream 4.0 的洗礼之后,OpenAI的图像生成模型也显得不那么够看了。主要就是价格更加便宜了。之前的 gpt-image-1的输入输出价格是在5刀、40刀。现在是在2刀、8刀。最重要的可能就是它们视频生成模型 S 以及 S pro的API版本更新。关于 S, 支持一种分辨率输出:720 x 1280。价格是0.1刀。支持两种不同的分辨率输出:720 x 1280 和1024 x 1792。价格是0.3刀和0.5刀。OpenAI 显然想把 ChatGPT打造成一个超级入口。现在可以在ChatGPT内直接使用其他 app,比如用 figma进行设计、zillow进行找房子或者使用 coursera进行上课等等。听上去很炫对不对,但是这个功能是不是看上去有点眼熟,好像在哪里见过? 只不过在 MCP的基础上,新增了一个回调的功能,允许外部应用返回一段 HTML界面,ChatGPT可以直接在聊天窗口这里显示这段 HTML的效果,可以是嵌入在对话中,也可以是全屏打开。 OpenAI把 Codex整合进了 Slack里。当然对我们而言,也没啥特别的用。简单理解这个实现,相当于是可以直接在企业微信里调用 CodeBuddy,想想还是挺帅的。结合之前 Anthropic 也发布了自己的 Claude Code SDK,反正这块 AI编程的大蛋糕,大家还得争抢。OpenAI亲自下场做这种画布工作流式的Agent 搭建平台了。之前市场上已经有了 dify, n8n, Zapier...一堆这类的低代码产品了 大家就使劲卷吧,看看这块最后到底是做大模型的公司通吃还是创业公司能分到一块蛋糕。虽然这些平台对无代码背景的同学确实是比较友好,但我自己其实对这类应用不是很感兴趣。因为它真的看上去只是一个AI 驱动的工作流(Workflow)平台,而不是一个 Agent。这两者其实是有非常明显的区别的。 真正的 Agent或者说,大家理想中的Agent应该是自行决定要做什么事情,比如调用工具,或者生成一个子 Agent等等,而不是依托于人为提前的设定。如果真的想学习一个 Agent的构建,还是推荐看看 Claude Code 、Codex、或者是比较好的Agent框架的实现。 但一个明显的变化是,OpenAI除了是一个做模型的 AI公司之外,也越来越向一个做 AI应用的公司靠拢。简单地来说,就是基础建设和上层应用,我一个都不能少。 |