返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

智能体知识库的三种数据格式

[复制链接]
链载Ai 显示全部楼层 发表于 4 小时前 |阅读模式 打印 上一主题 下一主题

知识库(Knowledge Base)是一个存储、组织和检索知识的系统化数据存储结构,支持 AI Agent 在特定场景下完成任务。它以多种数据格式存储知识,包括结构化数据、半结构化数据与非结构化数据


知识库的核心目标是将外部知识转化为模型可调用的数据形式,便于智能体进行检索、匹配与推理,提高对复杂问题的理解与回答准确性。


01

结构化数据知识库


  • 定义:结构化数据以表格、关系数据库(如 MySQL、PostgreSQL)的形式存储,数据具有明确的行列格式与字段定义,适用于FAQ 问答系统、规则匹配等场景。

  • 应用场景:

    • 传统的 FAQ 问答系统

    • 产品参数匹配与查询

    • 多轮对话中信息槽位填充


示例:高校招生问答系统的结构化数据


问题

答案

关键字段

录取分数是多少?

2023 年理科录取线为 580 分

分数、年份

是否提供奖学金?

提供多种奖学金,最高 5000 元/年

奖学金类型

专业有哪些?

包括计算机、经济管理、医学等 30 个专业



02


半结构化数据


  • 定义:半结构化数据介于结构化和非结构化数据之间,通常以JSON、XML 或 YAML格式存储,数据字段不固定,适用于动态知识调用与多模态数据解析的场景。

  • 应用场景:

    • 知识图谱构建

    • API 响应数据解析

    • 多维度数据检索

示例:智能客服知识库的半结构化数据

{"问题":"如何退货?","答案":{"退货流程":["申请退货","寄回商品","确认退款"],"退货期限":"7天无理由退货"},"分类":"售后服务"}



03


非结构化数据



  • 定义:非结构化数据包括文本、音频、视频、图片等无固定格式的数据形式,需要结合 NLP、OCR 等技术进行解析和检索。

  • 应用场景:

    • 文档解析与问答

    • 视频内容摘要与知识提取

    • 图片 OCR 解析与内容标注

示例:企业内部政策文件的非结构化数据

“2024年公司节假日安排:春节假期为1月21日至1月27日,其他法定节假日按照国家规定执行。”

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ