01。
概述
02。
Llama-3.1-Nemotron-51B
importtorch
importtransformers
model_id="nvidia/Llama-3_1-Nemotron-51B-Instruct"
model_kwargs={"torch_dtype":torch.bfloat16,"trust_remote_code":True,"device_map":"auto"}
tokenizer=transformers.AutoTokenizer.from_pretrained(model_id)
tokenizer.pad_token_id=tokenizer.eos_token_id
pipeline=transformers.pipeline(
"text-generation",
model=model_id,
tokenizer=tokenizer,
max_new_tokens=20,
**model_kwargs
)
print(pipeline([{"role":"user","content":"Heyhowareyou?"}]))
03。
效率与性能
04。
架构优化
05。
未来应用与影响
06。
结语
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |