链载Ai

标题: Ollama最新更新v0.1.33,实现了多并发可同时与多个模型聊天对话! [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: Ollama最新更新v0.1.33,实现了多并发可同时与多个模型聊天对话!

Hello,大家好!上周,Ollama进行了v0.1.33版本更新,为本地部署的开源大型语言模型(LLMs)带来了重大改进。现在,多用户可以在同一台宿主机上与LLMs进行互动,实现同时聊天对话。这一更新对于企业或团队用户是一个非常好的消息,它提高了本地协作效率还优化了用户体验。

新版本更新如下

增加了多个新的LLM型号:


修复内容:


实验性并发特性:

新的并发特性即将推出到Ollama。


如何设置并发及加载多个模型

Windows11为例(本地电脑)

1. 任务栏中退出ollama;

2. 在Windows11搜索栏中搜索设置>系统>系统信息>高级系统设置>环境变量

3. 在“系统变量”区域“新建变量“,以下为说明:

4. 全部确定后即可启动Ollama。

Linux为例

  1. 通过调用 编辑 systemd 服务systemctleditollama.service 这将打开一个编辑器。

  2. Environment对于每个环境变量,在部分下添加一行[Service]

#示例[Service]Environment="OLLAMA_HOST=0.0.0.0" #设置服务监听的主机地址Environment="OLLAMA_NUM_PARALLEL=4" #并行处理请求的数量Environment="OLLAMA_MAX_LOADED_MODELS=4" #同时加载的模型数量

3. 保存并退出。

4. 重新加载systemd并重新启动 Olama:

sudo systemctl daemon-reloadsudo systemctl restart ollama

tips:以上的变量值官方给出为4,并没有详细说明最大可以设置到多少。

测试

在多模型运行功能未启用之前,多个用户与单一模型的对话是以队列形式进行的。启用此功能后,对话将能够并行处理,从而显著提升了内网环境下多用户协同与一个或多个模型进行对话的效率。

运行一个模型

运行多个模型









欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5