返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

Ollama 0.3.4 版本已推出

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

新模型介绍

  • BGE-M3: 由北京智源研究院(BAAI)开发的大型嵌入模型,其特点在于能够多功能、多语言和多粒度的广泛适用性。

  • BGE-Large: 一款英文训练的大型嵌入模型。

  • Paraphrase-Multilingual: 一款支持50多种语言的多语言嵌入模型,基于平行数据训练。

全新支持批处理的嵌入API

Ollama 新增了一个API端点 /api/embed,专门用于生成嵌入信息:


curl <http://localhost:11434/api/embed> -d '{ "model": "all-minilm", "input": ["Why is the sky blue?", "Why is the grass green?"]}'

这个API端点新增了以下特性:

  • 批量处理:一次请求即可为多篇文档生成嵌入信息

  • 标准化嵌入:嵌入信息现已标准化,进而提升了相似度测量的准确性

  • 截断功能:新增了一个截断参数,若设为false则会报错

  • 性能指标:响应结果中会包含 load_duration(加载时长)、total_duration(总时长)和 prompt_eval_count(提示评估计数)等性能指标

更新内容

  • 修复了 Windows 上初始下载速度慢的问题

  • NUMA 支持现在会被 Ollama 自动侦测,以提升性能

  • 解决了 /api/embed 有时返回乱序嵌入结果的问题



❤️关注  ?点赞  ⭐转发
你的支持是我更新分享的最大动力?

合作/加群方式

微信号:brothers_talk

往期好文推荐?

  • Ollama 0.3.1-0.3.3 版本已推出

  • Ollama 0.3.0 版本已推出

  • Ollama 0.2.8 版本已推出

  • Ollama 0.2.6-0.2.7 版本已推出

  • Ollama 0.2.4-0.2.5 版本已推出

  • Google 的开源模型 Gemma 2

  • Ollama Docker 镜像

  • Ollama 对GPU 支持信息

  • Ollama Linux 使用指南

  • ollama 常见问题解答

  • Ollama 安装 llama3.1


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ