WebLLM 是一款高性能的浏览器内 LLM 推理引擎,它通过硬件加速将语言模型推理直接引入 Web 浏览器。一切都在浏览器内部运行,无需服务器支持,并通过 WebGPU 加速。
WebLLM与OpenAI API完全兼容。也就是说,您可以在本地对任何开源模型使用相同的 OpenAI API ,其功能包括 json-mode、函数调用、流式传输等。
我们可以带来很多有趣的机会,为每个人构建 AI 助手,并在享受 GPU 加速的同时保护隐私。
您可以使用 WebLLM 作为基础npm 包,并按照文档和查看入门指南在其上构建自己的 Web 应用程序。该项目是MLC LLM的配套项目,可实现 LLM 在硬件环境中的通用部署。
github:https://github.com/mlc-ai/web-llm
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |