2026年1月16日,Ollama v0.14.2正式发布。这次版本更新不仅带来了新的翻译模型集,还在接口规范与交互体验上进行了大幅提升,进一步巩固了Ollama在开源大模型生态中的核心地位。以下是详细更新内容与技术亮点:
Ollama v0.14.2推出了全新TranslateGemma模型系列。这一系列翻译模型基于Gemma 3架构构建,支持55种语言互译,旨在帮助全球用户打破语言壁障,实现跨语言交流。
TranslateGemma是Ollama针对跨语言任务优化的一类开放模型,标志着Ollama在多语言理解和生成能力上的进一步扩展。
Ollama命令行(CLI)现在新增了更简洁直观的交互方式:
这一改进使开发者编写长指令或复合Prompt更加方便,提升人机交互体验。
/v1/responses API优化
Ollama进一步改进了/v1/responses接口,使其更好地符合OpenResponses规范。该更新提升了API一致性与兼容性,对于使用Ollama搭建AI应用服务的开发者而言,这意味着更高的稳定性与标准化支持。
此次版本新增了**“Building with MLX(experimental)”章节,为想要探索Ollama与MLX库(机器学习加速框架)**集成的开发者提供完整构建步骤。
cmake --preset MLX
cmake --build --preset MLX --parallel
cmake --install build --component MLX
go build -tags mlx -o ollama-mlx .
./ollama serve
当需要使用CUDA加速时,可选用预设“MLX CUDA 13”或“MLX CUDA 12”:
.
cmake --preset 'MLX CUDA 13'
cmake --build --preset 'MLX CUDA 13' --parallel
cmake --install build --component MLX
这部分更新让Ollama更好地支持自定义加速和实验性运行环境,为AI开发者提供更多性能调优空间。
v0.14.2在文档中正式新增两个关键集成支持,为用户提供更多使用场景。
Onyx是一个可自托管的聊天UI,现已无缝对接Ollama模型,支持:
安装只需按照Onyx官方快速部署指南,选择Ollama作为LLM提供者,配置API地址即可完成接入(如Docker环境下使用http://host.docker.internal访问主机)。
Marimo是一款交互式Python笔记工具,支持通过Ollama提供AI功能:
http://localhost:11434/v1);通过简单配置后,即可在Marimo环境中调用Ollama提供的智能交互及推理服务。
Ollama官方完善了与Claude Code兼容的API文档,现需设置以下环境变量:
.
export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_BASE_URL=http://localhost:11434
export ANTHROPIC_API_KEY=ollama
或者直接运行:
.
ANTHROPIC_AUTH_TOKEN=ollama ANTHROPIC_BASE_URL=http://localhost:11434 ANTHROPIC_API_KEY=ollama claude --model qwen3-coder
此优化让 Claude Code 工具可顺利使用 Ollama 本地模型作为后端。
此次更新还包括:
tool_test.go中ToolCallFunctionArguments API检测逻辑。代码地址:github.com/ollama/ollama
Ollama v0.14.2是一个集模型扩展、命令行体验优化、API规范化与环境构建指南于一体的版本。
不仅强化了多语言支持,还让开发者在本地构建、部署与集成第三方工具时更高效、更稳定。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。
欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |