热搜: 活动交友 discuz

扫码关注官方微信

扫码下载APP

返回顶部

链载Ai › 核心板块 › 前沿技术 › ollama v0.13.3 最新发布：新增模型与功能优化详细解读 ...

链载Ai 关注Ta

发帖数41326
粉丝0

此人很懒，什么也没有留下

阅读作者更多精彩帖子

热门问答更多热门问答

技术文章更多技术文章

ollama v0.13.3 最新发布：新增模型与功能优化详细解读

[复制链接]

链载Ai 显示全部楼层 发表于前天 17:13 |阅读模式

上一主题

下一主题

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2025年12月12日，Ollama v0.13.3 版本正式发布。本次更新引入了多款全新模型，并对现有功能进行了优化与修复，为开发者在代码分析、多语言检索以及软件工程领域提供了更高效的支持。

一、全新模型

1. Devstral-Small-2

• 24B 参数模型
• 擅长使用工具探索代码库
• 支持多文件编辑
• 为软件工程类智能代理提供强大能力支持

2. rnj-1

• 8B 参数开源权重、稠密模型
• 由 Essential AI 从零开始训练
• 针对代码及 STEM（科学、技术、工程、数学）领域优化
• 性能可与当前开源权重领域的先进模型媲美

3. nomic-embed-text-v2

• 多语言 MoE（混合专家）文本嵌入模型
• 出色的多语言检索能力

二、功能优化与改进

1. 嵌入接口优化

• 改进了 /api/embed 与 /v1/embeddings 在使用时的截断逻辑

2. 架构扩展

• 在 Gemma 3 架构基础上扩展，支持 rnj-1 模型

3. 模型输入修复

• 修复了使用 qwen2.5vl 进行图像输入时出现的报错问题

三、近期更新的具体改动

• 截断逻辑优化：修正运行时截断逻辑，并移除服务器端截断
• rope 重构：提升模型在长上下文处理中的性能稳定性
• rnj-1 推理支持：新增对 rnj-1 模型的推理支持
• qwen2.5vl metal argsort 修复
• nomic-embed-text-v2 模型实现完善
• UI优化：

• 修复模型下载完成后能力不更新的问题
• 使用 Ollama 接口进行用户认证与健康检查
• 使用 requestAnimationFrame 防止文本底部被截断

• 性能提升：升级 llama.cpp（17f7f4）版本，提升 SSM 性能
• 命令行工具修复：

• 修正 cmd/bench 下 README 中的选项表与二进制文件名

• 路由优化：在工具调用中增加 logprobs 输出
• 模型调整：更新 ministral 与 devstral 的转换与超参数设置
• 模板功能增强：新增 yesterdayDate 辅助函数
• 嵌入性能优化：调整 embeddings 的批量大小
• API扩展：新增 v1/responses 接口支持
• rotary embeddings 修复：解决 ministral 3 在旋转嵌入上的问题
• 文档更新：调整 README 内容

四、更新总结

代码地址：github.com/ollama/ollama

本次 ollama v0.13.3 发布，不仅带来了三款定位不同的新模型，覆盖了代码分析、科学工程以及多语言检索等多领域，同时对嵌入接口、模型架构、性能以及开发者工具进行了广泛优化，进一步提高了使用体验与运行稳定性。

·

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

欢迎关注“福大大架构师每日一题”，发消息可获得面试资料，让AI助力您的未来发展。

·

回复

使用道具举报

发布主题

返回列表

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程，Suno AI音乐生成指南，以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整，手把手助您从入门到精通。

官方手机版
微信公众号
商务合作

Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司||