ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 12.6px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">LibOllamaPath作为库路径,本次更新统一改为ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-feature-settings: normal;font-variation-settings: normal;font-size: 12.6px;text-align: left;line-height: 1.75;color: rgb(221, 17, 68);background: rgba(27, 31, 35, 0.05);padding: 3px 5px;border-radius: 4px;">ml.LibOllamaPath,保证路径引用一致性,提升跨平台与多设备环境下的稳定性。discover/runner.go中多处将LibOllamaPath替换为ml.LibOllamaPathml/device.go中LibraryPaths函数初始化时确保LibOllamaPath包含于 GPU 库路径列表中这些改动有助于在 GPU 初始化阶段正确加载相关库文件,尤其是在混合 GPU 环境中(CUDA 与 ROCm 并存)。
新增对ROCm error的日志监控,llm/status.go的errorPrefixes列表中增加了"ROCm error"条目,使错误信息能够被及时捕获与输出,便于定位问题。
在 CUDA 后端实现中增加了对内存设置与拷贝操作的优化逻辑:
cudaMemsetAsync操作,从而减少 GPU 内存分配压力cudaMeMCPyAsync、cudaMemcpy2DAsync、cudaMemsetAsync进行了宏替换,使其在预留阶段直接返回成功,而不执行实际操作ggml/src/ggml-cuda/common.cuh和ml/backend/ggml/ggml/src/ggml-cuda/common.cuh中均有实现,使 CUDA 后端在图优化阶段更高效效果:
integration/api_test.go中移除了冗余的TestAPIEmbeddings测试方法,此前该测试会调用嵌入 API(Embeddings),包括模型拉取与输出验证,此处删除主要是简化测试集,避免重复测试相同功能。
discover/path.go文件更名为ml/path.go,并将包名从discover改为ml,归类到机器学习核心逻辑下,使模块结构更加清晰。
ollama v0.12.9 在保持功能稳定的同时,解决了 CPU-only 系统的性能问题,并且显著优化了 GPU 设备检测、ROCm 错误日志及 CUDA 内存分配机制。这些改进对在多种硬件环境中部署 Ollama 的用户尤为重要:
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |