|
Kotaemon 是一个基于检索增强生成(RAG)的开源工具,旨在实现与文档对话的能力。该工具为终端用户和开发人员提供了一个干净且可定制的用户界面,使用户能够在其自己的文档上进行问答,并允许开发人员构建自己的 RAG 管道。 ? 基于 RAG 的文档问答开源 UI ?️ 支持本地大语言模型和 API 提供商 ? 具备全文和向量搜索能力的混合 RAG 管道 ?️ 支持图表和表格的多模态问答 ? 带有浏览器内 PDF 预览的高级引用功能 ? 复杂推理以分解问题 ⚙️ 可配置的设置界面 ? 基于 Gradio 的可扩展架构
Kotaemon的主要特点 文档问答Web界面 Kotaemon提供了一个支持多用户登录的Web界面,用户可以在此组织文件、创建公开或私人的收藏夹,并与他人共享聊天记录。这使用户能够轻松进行文档问答和管理及分享使用经验。 多模式和混合RAG流水线 支持多种大型语言模型(LLMs)和嵌入模型,包括本地模型和OpenAI、Azure、Ollama等流行的API提供商。Kotaemon使用混合(全文搜索和向量)检索器和重新排序技术,确保最佳的检索质量,支持多模态问答,并能够解析包含图表和表格的文档。 高级引用和文档预览 默认情况下,提供详细的引用以确保大型语言模型的回答正确性。用户可以在浏览器内置的PDF查看器中查看引用,当检索到的文章的相关性较低时,文档会突出显示相关内容并发出警告。 复杂推理支持 Kotaemon支持通过问题分解来回答复杂或多步问题,并支持基于智能体的推理方法,如ReAct和ReWOO等。这些功能使Kotaemon能够处理更复杂的问答场景。 可配置的UI和可扩展性 用户可以在UI中调整检索和生成过程中的各种关键参数,由于Kotaemon是基于Gradio构建的,因此用户可以自由地自定义或添加任何UI元素。该项目还支持多种文档索引和检索策略,并提供GraphRAG索引流水线作为示例。 安装与部署 该项目提供了一个简单的安装脚本。用户可以通过Docker快速部署服务器,或在本地克隆项目并配置环境变量来启动服务。默认的用户名和密码为admin/admin,用户可以直接在UI中设置其他用户。 
Kotaemon的应用场景及发展前景 Kotaemon适用于需要对文档进行复杂问答的场景,例如企业内部知识库的构建、研究文献的分析以及教育领域学习资源的管理。其开源性质和高度可定制性允许开发人员根据具体需求进一步扩展和优化系统功能。 
项目网站:https://github.com/Cinnamon/kotaemon 项目文档:https://cinnamon.github.io/kotaemon/ 在线演示:https://huggingface.co/spaces/cin-model/kotaemon-demo |