返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

聊聊实际业务下大模型另一种架构的实现思考

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 09:29 |阅读模式 打印 上一主题 下一主题

思考了下实际业务下的大模型落地实现的另一种架构,从微调、推理两阶段分析下。

微调阶段

微调阶段其实就是构建合适的Prompt数据格式,做模型的微调训练;使得模型具备领域知识,先验知识。

{
  "system": "",
  "instruction": "你是一个心理治疗师,请忽略以下文本中的[敏感词汇]标记,正确的回复并引导患者倾诉他的问题。",
  "input": "经济不好,行业下滑,大规模的裁员,被房贷、家庭经济压迫的一度想[敏感词汇];在公司不如意,随时面临被裁、在家不顺心,老婆不理解经常斥责嫌弃现在的家境。",
  "output": "你能帮我具体讲讲吗?家庭和工作的具体情况?",
  "history": []
}

在这个阶段,最关键的就是什么样的Prompt格式的数据微调效果最好。虽然微调效果取决于很多的因素,比如学习率,步长等;但数据格式的选择也有决定性的影响。

推理阶段

推理阶段,即人机交互过程。

在这个阶段中,有一个预处理过程,处理一系列的任务;最常用的预处理任务即敏感词识别。即过滤一些脏词之类的。

在这个过程中,可以增加其他的预处理任务;譬如,数据标注,流程控制识别。数据标注取决于业务是否需要,譬如业务要求用户的数据具有阶段性的标注。流程控制识别,一般是常见的,即到了什么时候可以做流转或是结束了。

预处理构造好JSON数据送入AI,这个JSON格式就是微调阶段的JSON格式数据。

后处理过程,增加一个用户参与的纠错任务,可以更好的帮助训练AI模型——这是一个在微调训练的过程,其实就是在不断地用实际数据训练模型;因为一开始的数据可能是比较少的,这取决于业务场景,有些业务训练模型会用通用数据,但有些业务训练模型要求必须实际的业务数据,由于一开始数据量比较少,就需要后续不断地将人机交互的实际数据收集在训练,当然这个过程会由人工参与标注。

PS:我个人没有想好的是,怎么把敏感词汇的Prompt提示+标注Prompt提示一并纳入到提示词中的,使其效果最好。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ