返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

25.7k star! 用langchain-chatchat部署私有化RAG知识库

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

langchain-chatchat是一个基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型知识库项目,采用Apache License,可以免费商用。该项目支持市面上主流的本地大语言模型和Embedding模型,支持开源的本地向量数据库。

以下是作者实测部署问答效果:

1.docker一键部署

不需要在宿主机上安装CUDA,但需要安装NVIDIA Driver以及NVIDIA Container Toolkit,安装方法参考https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html,接下来使用docker一键部署:

dockerrun-d--gpusall-p8501:8501--namelangchain-chatchatregistry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7

镜像43.1G,需要等待较长时间。部署成功后访问http://localhost:8501

2.聊天

聊天界面支持多种LLM,可以自己选择。但总体来说实现比较简单,没有账号管理与自动保存聊天等功能,设置的参数也不能保存,与之前介绍的247.2k star! 超强大的私有化ChatGPT,支持图像识别/文生图/语音输入/文本朗读,个人电脑可运行!相比逊色不少。

3.知识库

知识库的功能做的还不错,新建知识库时有多种Embedding模型可以选择:
支持多种文档格式和分词参数设置
问答前需要选择模型,并且选择一个知识库(一个知识库可以包含多个文档),作者找了一个新闻测试知识库问答,没有回答出来,知识库问答需要嵌入模型、分词参数和大模型结合使用,可能还是配置的不合理。

4.总结

个人感觉聊天的体验一般,知识库的功能设计还不错,但是问答的效果不太好,感兴趣的朋友可以留言讨论一下用哪些模型和参数能达到比较好的效果,也可以推荐一些实测效果较好的项目。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ