链载Ai

标题: RAG 已死,上下文工程当立 [打印本页]

作者: 链载Ai    时间: 昨天 14:24
标题: RAG 已死,上下文工程当立
朋友们好,今天给大家带来最新的 Latent Space 的一期播客的内容,这期内容非常有价值,跟当下最火的概念,上下文工程,息息相关。同时内容里也提到了 RAG,Memory 等这些非常核心的要素。
他们采访的对象是 Chroma 的创始人,Jeff Huber, 来分享一些他的观点。
原视频地址:
https://www.youtube.com/watch?v=pIbIZ_Bxl_g
另外,这里介绍一下 Chroma。做过 AI 应用开发,特别是 RAG的同学应该不是很陌生,Chroma 是一个开源的向量检索数据库,提供 AI 应用所需要的向量检索+关键词全文检索+正则+元数据过滤的一体化方案。可以本地嵌入式运行,也可连到托管的 Chroma 云端上。
所以,作为 Chroma 的创始人,Jeff 分享的内容还是很值得一看的。我对此进行了一些整理,希望大家理解起来更加方便一些。
那,我们现在开始。
1.上下文工程:AI 时代的核心技能
对于最近很火的上下文工程,Jeff 将其定义为:在任何给定的LLM 生成步骤中,精确决定上下文窗口应包含何种信息的任务。
这里包含了两个循环,Jeff 认为一个是内循环,决定当前这一步中,应该塞入哪些内容给到模型作为上下文,还有一个是外循环,随着对话次数的增加、时间的积累,逐渐要让模型选择最相关的信息。
他甚至批评RAG这一个术语,认为它将检索、增强、生成三个概念硬拼在一起,且常被误解为只做单次的向量检索。Jeff 自己说他是从来不用 RAG 这个词汇的。
「emmm..确实是这样,做过 RAG 项目的同学其实都有经验,RAG 中最重要的就是检索这一环节,如果检索内容都出现问题了,后面的增强、生成都是白扯,所以 RAG 其实就是只有检索这一part」
Chroma 通过研究,发现当前的 AI 应用中存在着严重的上下文腐烂的问题。当模型的上下文窗口中存在着更多 Token 时,模型的注意力会下降,推理能力也会随之减弱。对于当前前沿模型声称能够完美利用百万级 Token 上下文窗口的说法,Jeff 也保持着怀疑的态度。Chroma 的报告显示,许多模型在长上下文的场景中的性能并不理想。
「作为一个经常评测各大模型的博主,这点真的深有同感。很多模型虽然声称虽然有 256k 甚至 1M 的上下文窗口,但是长上下文表现非常不理想。 推荐阅读 MinMax 的长上下文评测:DeepSeek用户看过来:这个开源模型的上下文是它的15倍,还能思考80k字" data-itemshowtype="0" linktype="text" data-linktype="2">DeepSeek用户看过来:这个开源模型的上下文是它的15倍,还能思考80k字」
为了解决这些问题,Jeff 同样分享了上下文工程中的实用策略:
「无数论文、实验证明,好的数据质量决定一切」
2. 未来检索系统的进化
Jeff 对未来的检索系统的优化方向提出了两个进化的方向:

3. 关于 AI 记忆:本质是更好的上下文调度
Jeff 非常推崇记忆这个概念,,因为记忆这个词非常的拟人化,而且无论是 AI 圈内的人还是外人都能一下子听得懂这是在说什么。
AI 记忆,本质上是上下文工程的体现。我们所要考虑的是如何将正确的信息放入到上下文窗口中。
Jeff 非常反对造新词,尤其是市面上有层出不穷的记忆概念,大多数情况下,它们的本质是相同的。他推崇类似数据库里的离线处理、数据压缩和重索引概念,让 AI系统通过持续的自我改进来实现记忆功能。
4. 创业哲学与方法论
在访谈的最后,Jeff 也分享了他自己的创业哲学和人文关怀。他的人生完全就是北极星原则:只做自己热爱的工作、只与自己喜欢的人共事,只服务自己认同的客户。
他强调他自己创业其实是为了不仅仅是想把工作做好,更想让自己做的工作被更多的人看到。真正的影响力在于发明出伟大的事物,并尽可能让更多的人使用。
同时,他还深入探讨了品牌和文化的重要性。他认为一个公司的创始人必须得是公司的品味策展人。创始人最在意的东西,往往会成为公司做到极致的部分。他要确保从办公室环境、网站设计、API 体验到内部面试流程,每一个环节都展现出一致的,高质量的品牌体验。他将此视为自己作为创始人为公司做的最重要的事情之一。
在团队建设上,çhroma 秉持着慢招、精选的原则。Jeff 寻求那些真正热爱工作、对工艺和质量有极高标准、能独立执行,并愿意与团队并肩作战的工程师和设计师。
「没错,现场打起了招聘广告了」
特地去看了下 Chroma 的官网,确实挺漂亮的。
5.写在最后
好啦,今天的分享就先到这儿了~
Jeff 的分享还是非常有价值的,真的推荐大家对这一期的视频反复观看,尤其是他不仅仅分享了他对当前技术的思考,还讲述了他自己创业的一些经历以及工作的一些原则。这些东西无论是对我们自己的工作还是生活都会非常有益。

以上,






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5