返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

1.8K Star!RAGapp:一个基于Agentic RAG模型的企业级应用,是企业使用Agentic RAG的最简单方式

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 10:14 |阅读模式 打印 上一主题 下一主题

项目简介

RAGapp[1] 是一个基于 Agentic RAG(Retrieval-Augmented Generation)模型的企业级应用,旨在简化企业使用 Agentic RAG 模型的过程。

项目提供了一个简单的 Docker 部署方式,允许用户在自己的云基础设施中部署和配置 RAGapp,项目由 LlamaIndex[2] 构建。

使用场景

  • 企业内部需要使用先进的 AI 模型来增强业务流程或提供智能服务。
  • 需要在本地云基础设施中部署 AI 模型,以保证数据安全和合规性。
  • 需要一个易于配置和管理的界面来操作 AI 模型。

使用方法

快速开始

要运行RAGapp,可以使用以下命令启动一个Docker容器:

dockerrun-p8000:8000ragapp/ragapp

启动后,可以通过访问http://localhost:8000/admin来配置你的RAGapp的Admin UI。

支持的AI模型

可以使用OpenAI或Gemini提供的托管AI模型,也可以使用Ollama[3]提供的本地模型。

暴露的端点

Docker容器公开了以下端点:

  • Admin UI: http://localhost:8000/admin
  • Chat UI: http://localhost:8000
  • API: http://localhost:8000/docs

请注意,Chat UI和API只有在RAGapp配置完成后才能正常工作。

安全性

RAGapp默认不包含任何认证层。为了确保你的RAGapp安全,请在你的环境中保护/admin路径。

部署方式

使用Docker Compose

RAGapp提供了一个docker-compose.yml文件,以便在自己的基础设施中轻松部署RAGapp与Ollama和Qdrant[4]

使用MODEL环境变量,可以指定要使用的模型,例如llama3

MODEL=llama3docker-composeup

如果没有指定MODEL变量,默认使用的模型是phi3,它比llama3功能较弱,但下载速度更快。

注意:docker-compose.yml文件中的setup容器将把选定的模型下载到ollama文件夹中,这可能需要几分钟时间。

使用OLLAMA_BASE_URL环境变量,可以指定要使用的Ollama主机。如果没有指定OLLAMA_BASE_URL变量,默认指向由Docker Compose启动的Ollama实例(http://ollama:11434)。

如果正在运行本地Ollama实例,可以通过设置OLLAMA_BASE_URL变量将其连接到RAGapp:

MODEL=llama3OLLAMA_BASE_URL=http://host.docker.internal:11434docker-composeup

如果在macOS上运行RAGapp,这将非常有用,因为Docker for Mac不支持GPU加速。

Kubernetes

在自己的云基础设施中部署RAGapp也很容易。定制的Kubernetes部署即将推出。


注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ