2)软件
2、环境准备 1)安装显卡驱动 sudoaptinstallnvidia-driver-535 2)安装cuda12.2 wgethttps://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.runsudoshcuda_12.2.0_535.54.03_linux.run 3、模型下载(魔塔社区)
4、安装vllm、Ray以及依赖库 sudopip3installvllmray[default]openaitransformerstqdm 5、启动Ray集群 1)其中一台机器作为主节点,执行: nohupraystart--block--head--port6379&>/var/log/ray.log& 2)另外一台机器作为从节点,执行: nohupraystart--block--address='<masterIP>:6379'&>/var/log/ray.log& 3)查看集群状态 raystatus 出现类似日志说明集群正常:
6、使用vLLM启动模型 两台机器都执行:
参数说明:
7、测试大模型是否正常访问 curlhttp://127.0.0.1:8080/v1/chat/completions\-H"Content-Type:application/json"\-d'{"model":"DeepSeek-R1","messages":[{"role":"user","content":"你是谁?"}],"max_tokens":1024}' |