返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

Ollama更新到v0.3.4

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

本次更新重点是嵌入(Embedding)模型。

引入新的嵌入模型(embedding models)

    • BGE-M3:来自BAAI的大型嵌入模型,因其在多功能性、多语言性和多粒度方面的灵活性而著名。

    • BGE-Large:一个以英语为训练语言的大型嵌入模型。

    • Paraphrase-Multilingual:一个多语言嵌入模型,训练于50多种语言的平行数据上。


新嵌入API支持批处理:

Ollama现在支持新的API接口 /api/embed 用于生成嵌入:

curlhttp://localhost:11434/api/embed-d'{"model":"all-minilm","input":["Whyistheskyblue?","Whyisthegrassgreen?"]}'

此API接口支持的新功能:

    • 批量处理:一次请求生成多个文档的嵌入

    • 标准化嵌入:嵌入现在被标准化,提高相似性结果

    • 截断:新增加的截断参数,设置为false时会报错

    • 统计指标:响应中包含 load_duration、total_duration 和 prompt_eval_count 指标


其他变更内容:

    • 修复了Windows上初始下载速度缓慢的问题

    • NUMA支持将由Ollama自动检测,以提高性能

    • 修复了/api/embed有时返回嵌入结果顺序错误的问题

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ