Xinference Dify本地部署全攻略：知识库搭建与模型配置详解(附一键安装包)

显示全部楼层

随着大家的深入使用，发现ollama部署大模型虽然方便，但是Dify知识库混合检索，需要有rerank模型，这一点上，ollama是不支持rerank模型的。

因此，部署一个Xinference平台来部署rerank模型的呼声越来越强烈。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">于是，我就安排上了这篇部署教程。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 1em;color: rgb(63, 63, 63);">一、什么是Xinference？

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">Xinference（全称Xorbits Inference）是一个性能强大且功能全面的分布式推理框架，旨在为各种AI模型的运行和集成提供便捷的解决方案。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">你可以理解为：它是一个超级智能小助手，可以帮你把各种厉害的AI模型轻松部署在本地并运行起来，让它们在你的电脑或者服务器上高效地干活。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 1em;color: rgb(63, 63, 63);">二、安装Xinference

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">请注意：安装xinference需要电脑支持 NVIDIA 的 GPU，否则，后面的步骤无法运行

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;display: table;padding: 0px 0.2em;color: rgb(255, 255, 255);background: rgb(89, 103, 244);">一）打开 powershell

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 14px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">按下 win 键，搜索并打开powershell：

二）创建容器宿主机目录

造打开的powershell中粘贴如下命令，递归创建所需目录：

注意：目录位置可以根据自己电脑情况进行调整，此处默认创建在了C盘根目录，以后xinference的数据都会存在此处

mkdir"C:\xinference"

三）拉取xinference镜像并创建容器

还是在打开的powershell中粘贴如下命令，拉取并创建启动xinference容器：

请注意：本步是安装xinference，需要电脑支持 NVIDIA 的 GPU，否则，无法运行，会报如下错误：

& docker run -d `
  --name xinference `
  -v "C:\xinference:/xinference" `
  -e XINFERENCE_HOME="/xinference" `
  -p 9997:9997 `
  --gpus all `
  xprobe/xinference:latest `
  xinference-local -H 0.0.0.0 --log-level debug