返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

OpenAI终于推出Prompt Caching:成本砍半、速度翻倍!细节介绍都在这里了

[复制链接]
链载Ai 显示全部楼层 发表于 7 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-top:8px;padding-bottom:8px;margin:1em 4px;line-height:26px;color:black;">OpenAI 终于推出Prompt Caching 给开发者省钱了。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-top:8px;padding-bottom:8px;margin:1em 4px;line-height:26px;color:black;">ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;margin:0 auto;width:auto;max-width:100%;" width="auto"/>

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-top:8px;padding-bottom:8px;margin:1em 4px;line-height:26px;color:black;">OpenAI最新推出的ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;color:#35b378;">Prompt Caching功能,一下子就让API调用成本腰斩,速度翻倍。这下,AI应用开发者们该笑醒了。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-top:8px;padding-bottom:8px;margin:1em 4px;line-height:26px;color:black;">让我们来看看这个新功能:

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;padding-top:8px;padding-bottom:8px;margin:1em 4px;line-height:26px;color:black;">成本砍半,速度飙升


OpenAI这次真的是下了血本:
    ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;margin-bottom:8px;padding-left:25px;color:black;list-style-type:disc;" class="list-paddingleft-1">
  • ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;margin-top:-10px;">
    ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;color:#35b378;">成本直接减半:长提示词的API调用成本降低了50%
  • 速度提升惊人:延迟降低了80%

这意味着什么?

简单来说,开发者可以用更少的钱,做更多的事

适用范围广,自动生效


这可不是什么小打小闹的实验性功能。OpenAI直接把它应用到了主力模型上:

  • GPT-4o
  • GPT-4o mini
  • o1-preview
  • o1-mini

最爽的是,这个功能是自动应用的。开发者们不需要修改一行代码,就能享受到这个福利。

缓存机制详解


那么,这个神奇的缓存是怎么工作的呢?
  • 缓存触发条件:提示词超过1,024个token
  • 缓存增量:以128个token为单位递增
  • 缓存匹配:需要完全匹配前缀才能命中缓存
  • 缓存保留时间:5-10分钟无活动后清除,最长保留1小时
  • 监控方式:通过API响应中的'cached_tokens'字段查看

开发者优化建议


OpenAI还贴心地给出了优化建议:
  1. 静态内容放在提示词开头,这样更容易命中缓存
  2. 缓存的输入token价格是未缓存token的一半
  3. 无需任何代码修改,系统会自动应用缓存

@bidhanxyz( @bagel_network 的创始人)甚至预测:

有人会在API上实现模糊缓存,将成本再降低50%。

这话说的,OpenAI的工程师们怕是要加班了。

@ShenHuang_(Google Travel Ads的技术主管)也表示:

这可以节省我大量的API调用成本?

看来,不只是小开发者,连大公司都对这个功能垂涎三尺啊。

AI开发的春天来了?


这个功能早有呼声,@AI_GPT42说到:

我一直在等这个功能?

OpenAI这一次,终于回应了开发者的需求。可以说是跟上了其他厂商(如deepseed, claude等),为AI应用开发铺平了道路

成本降低,速度提升,用同样的钱能干更多的事,这也意味着更多的创新可能性。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ