返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

OpenAI重磅:全新自主Agent意外曝光!

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 17:04 |阅读模式 打印 上一主题 下一主题


惊人的性能数据

在「Operator System Card Table」中,这个神秘的AI Agent在浏览器操作中拿下了87.0%的高分,远超Claude 3.5 Sonnet的56.0%和Google Mariner的83.5%。

更令人惊讶的是,在电脑操作方面,评测结果是38.1%,也是大幅超过Claude 3.5 Sonnet的22%

安全性能出众

在处理潜在危险指令时,Operator展现出了极高的安全性。根据数据显示,拒绝率均达到了97%以上。这意味着它能够有效识别并拒绝执行可能存在风险的操作指令。

更多细节即将揭晓?

据axios报道,Sam Altman已经安排了一场与美国政府官员的闭门会议,定于1月30日举行。很多人都在猜测,这可能预示着一个关于超级Agent的重大突破即将公布。

有消息称,Operator将作为ChatGPT应用的一部分推出。考虑到o3-mini即将发布的消息,这个时间点的选择似乎也很合理。

最后

从目前披露的技术指标来看,尽管Operator在某些方面可能略逊于GPT-4o,但其自主操作能力和安全性都已达到了相当高的水平。

不过昨天Sam Altman表示,会发布一些比较酷的东西,但是不要有太高预期,把预期降低100倍~ 另外有意思的是,头条评论是Deepseek r1的模型卡,并表示我们已经看到了AGI的火花。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ