返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

为了不让 AI 变笨,我决定把聊天记录变成满天繁星

[复制链接]
链载Ai 显示全部楼层 发表于 3 天前 |阅读模式 打印 上一主题 下一主题

本来要睡觉了,有个想法突然钻进我的脑袋,憋不住了,扶我起来。


我在用大模型的过程中经常遇到对话太长、内容到处漂移的场景。

比如我要设计一个功能,最终希望产出的是功能prd。但是在讨论过程中,对话内容可能会经过这些话题:

A.技术可行性分析

B.合规性分析

C.用户流程讨论

D.修改html交互demo

E.产出prd

其中每个话题可能都会有多轮对话,导致整个对话流非常非常长,我经常遇到以下这些问题:

1.当我在讨论D的时候,突然想起来B好像还有没聊透的,疯狂翻聊天记录或者搜索列表

2.当我在聊B的时候,可能讨论了B1/B2/B3多个方案,其中只有B1是靠谱的。结果B2/B3的内容会污染下面的对话。

3.当我在讨论D的时候,突然觉得B不对,回过头去修改B,然后又得从头修改D。

现在的解决手段,很多时候是每聊完一个话题的时候“及时存档”,让大模型总结一篇巨详细的阶段性总结(相当于是给下个阶段的需求文档了),然后新开个对话,导入这个文档,接着聊下个话题。但是只要是总结就一定会有信息丢失,只要新开了对话,就免不了一通重复的解释。

除此之外,我还遇到一个问题是,为了方便干活我封装了一批Gem,比如专门写prd的、专门做ppt的、专门分析需求的。但是Gemini对话窗口一旦选定了Gem,就是“终身聘用制”,中途无法更换Gem(员工的积极性怎么保障啊魂淡)。所以涉及到工种切换的时候,就不得不存档、新开对话了。这种情况遇到前面的讨论内容发生修改就更抓狂了,要在几个对话中间疯狂同步内容。


我有个“对话星图”的想法。如果每轮对话是一颗星星,那么整个冗长的对话流大概率不是线性的,而是放射状的——核心命题会发散出来少数几个方向,每个方向又会进一步发散,有点像个星图,也有点像流放之路的天赋树。

(流放之路的天赋树全览)


那么我能不能像点天赋一样:

生成星图:根据对话顺序和对话内容,自动识别节点之间的前后关联关系,画出来一张蜘蛛网。

识别核心节点:根据对话内容和星图结构,自动找到比较核心的那些节点(比如子节点最多的那几个?)。

框选或吸附:能够用鼠标快速框选一批节点,或者自动根据关键词“吸”出来相关的节点星团,把他们作为最高优的上下文。

技能转职:能够让指定的gem处理选中的节点星团


下面是我用html做了个demo,差不多是这个样子,但感觉真实的对话要更复杂一点。

可以看到这个星图中,能显示关键节点、关键节点有关键词帮助我们识别相关星团讨论了什么内容。

点击每个节点,能够大体预览一下对话内容,应该也能快速定位到对话流的对应位置。

框选一批节点,其他节点变暗。这个交互是我用鼠标选的,按理说这里能有一些自动化的策略。

后续的处理交互我没做,比如我可以指定一个gem处理框选后的节点、我可以批量删除一些节点、我可以把选中节点团里面的内容修改之后再对接到之前下游的节点……


下面几个产品可能跟我的想法有些类似:

Heptabase是个笔记产品,他能展示笔记页与页之间的关系。但我理解跟对话星图的场景差异还是很大的,Heptabase是在长期学习过程中积累笔记的单页,通过分析页与页的关系达到学习的目的。对话星图是针对一次对话、一次任务,星图的作用不是为了归纳知识,而是为了筛选上下文。


TheBrain 15是个脑图产品,有AI生成结构图的能力,一打眼看上去是交互上最像的产品。但是目的仍然截然不同,TheBrain 15认为结构本身是有价值的,这个工具是为了生成图谱。我正好反过来,我的星图(图谱)只是为了帮助我完成任务的工具。

Cursor反而是最像的。Cursor选择一段代码然后修改的交互,本质上跟我想干的事差不多。只是我想选中的不是代码,而是一些对话。


我想了下星图的交互也不关键,关键是能让我做到这几点:

  • 直观、便捷地管理过去的对话

  • 能够选取部分对话,使用指定的技能


这玩意会是自嗨吗?反正在我自己的场景肯定是需要的。但我对大模型底层知识没那么懂,问了下Gemini,它提到了一些局限性:

  • 只适用于专业用户。对的,普通用户不需要这个。当然能满足普通用户的交互,一般来说也满足不了我这种重度的、“人机共驾”的研究场景。

  • 自动识别节点关系的算法难度。这个我不懂,有懂的朋友讲讲么。

  • LLM厂商的架构进化。确实,如果基座模型对上下文的管理能力更智能一些,就不需要我手动管理了。


它也提到了一些类似的尝试:

  • LangGraph(LangChain 旗下的库): 这是给程序员用的。它允许开发者把 AI 的工作流画成图,每个节点可以接不同的模型。你的想法其实是把 LangGraph 的能力给“UI 化/平民化”了。

  • Cosmos(由开发者在 GitHub 尝试的实验项目): 尝试将聊天界面做成无限画布,每个回复是一个气泡,可以随意连线。

  • Tana: 一个节点化笔记工具,它最近在尝试让 AI 自动在节点流中提取结构化数据。



当然,我在写这篇文章的时候,旁边就开着Gemini,顺手让它分析了下这次讨论是否适合用对话星图提效:


Emmm,好像还不错哦。这篇文章其实分成了3个对话流,一个是它分析的这个Gemini直接对话;二是我用canvas尝试实现自己的想法,后来发现canvas还是不太行;三是用notebookLM,然后也不太行。而我实际使用情况中,对话的轮次是远远超过这个的,感觉还是有点用,不是么?哪怕就是帮我切换Gem呢?


认真想想,“对话星图”实际上就是让 AI 像代码版本控制(Git)一样管理思考过程:

- 每一个节点是一个 Commit。

- 每一个星团是一个 Branch。

- 框选并交给 Gem 处理是 Merge & Build。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作