返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

本地化大模型接入RagFlow错误记录

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 17:56 |阅读模式 打印 上一主题 下一主题
前两天搭建一个RagFlow和基于vLLM框架的QwQ-32B模型,今天尝试把QwQ-32B接入RagFlow,测试一下RagFlow的功能,以及基于它构建Rag模型的效果。结果一堆错,改了半天,这里记录一下
错误:连不上 connection error
  • 首先确保宿主机是能够连得上大模型的服务的
  • 登录ragflow容器内部测试连接,果然,连接失败
dockerexec-it0b527d272baa/bin/bashcurl-Ihttp://10.10.10.10:8080
  • 怀疑是容器的网络配置有问题,于是检查相关的配置文件docker-compose-CN-oc9.yml,果然发现问题,在部署ragflow的时候为了避开端口冲突,我把原文件(docker-compose.yml)中的80端口改成了8090,也就是容器的80端口映射到宿主机的8090端口,但是我没改docker-compose-CN-oc9.yml 中的配置!!!
    • 修改完成后重启Docker服务
sudosystemctlrestartdocker
    • 重新进入ragflow容器内部验证是否连通
curl-XPOSThttp://10.128.32.23:8080/v1/chat/completions\>-H"Content-Type:application/json"\>-d'{>"model":"QWQ-32B",>"messages":[{"role":"user","content":"你好"}]>}'
  • 顺利连通,到这里本来以为没事了,但是……
还是连不上,我真的天都塌了
  • 继续排查,发现虽然我在部署QwQ-32B的时候比没有设置API-Key,但是在用代码or框架连接的时候这个API-Key必填!!!补充之后,连接成功!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ