git clone https://github.com/pytorch/torchchat.gitcd torchchatpython3 -m venv .venvsource .venv/activate./install_requirements.sh
python3torchchat.pychatllama3.1
streamlitruntorchchat.py--browserllama3.1
下表展示了Llama 3 8B Instruct在M1 Max和64GB RAM的Apple MacBook Pro上的性能,MPS显示出明显的加速。
MPS (Metal Performance Shaders)是Apple提供的一个图形和计算框架,用于利用GPU进行高效的计算确保最佳性能。
Torchchat在移动设备上的表现同样令人印象深刻。在三星Galaxy S23和 iPhone上通过ExecuTorch使用4 位GPTQ量化实现每秒超过8个令牌。这种性能水平可在现代智能手机上实现响应迅速的设备端 AI 体验。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |