链载Ai

标题: Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA[1] LORA [2] 的训练方法 [打印本页]

作者: 链载Ai    时间: 昨天 09:32
标题: Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA[1] LORA [2] 的训练方法

ingFang SC", BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif;font-size: 14px;letter-spacing: normal;text-wrap: wrap;">


介绍

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">Llama3-Chinese以Meta-Llama-3-8B为底座,使用DORA[1]+LORA+[2]的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">Github:https://github.com/seanzhang-zhichen/llama3-chinese

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">

ingFang SC", BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.2em;display: table;border-bottom: 1px solid rgb(248, 57, 41);">模型下载

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;background: rgba(0, 0, 0, 0.05);">
ModelDownload
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">Meta-Llama-3-8BingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">? HuggingFace[3]? ModelScope[4]
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">Llama3-Chinese-Lora? HuggingFace[5]? ModelScope[6]
Llama3-Chinese (合并好的模型)? HuggingFace[7]? ModelScope[8]

合并LORA模型(可跳过)

1、下载Meta-Llama-3-8B[9]

gitclonehttps://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B.git

2、下载Llama3-Chinese-Lora[10]

From ModelScope

gitlfsinstallgitclonehttps://www.modelscope.cn/seanzhang/Llama3-Chinese-Lora.git

From HuggingFace

gitlfsinstallgitclonehttps://huggingface.co/zhichen/Llama3-Chinese-Lora

3、合并模型

pythonmerge_lora.py\--base_modelpath/to/Meta-Llama-3-8B\--lora_modelpath/to/lora/Llama3-Chinese-Lora\--output_dir./Llama3-Chinese

下载 Llama3-Chinese(合并好的模型)

From ModelScope

gitlfsinstallgitclonehttps://www.modelscope.cn/seanzhang/Llama3-Chinese.git

From HuggingFace

gitlfsinstallgitclonehttps://huggingface.co/zhichen/Llama3-Chinese

vllm web 推理

1、使用vllm[11]部署模型

python-mvllm.entrypoints.openai.api_server--served-model-nameLlama3-Chinese--model./Llama3-Chinese(换成你自己的合并后的模型路径)

2、在命令行执行

pythonvllm_web_demo.py--modelLlama3-Chinese

训练数据集

匠数科技大模型sft数据集[12]

LICENSE

本项目仅可应用于研究目的,项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。详细请参考免责声明[13]

Llama3-Chinese项目代码的授权协议为The Apache License 2.0[14],代码可免费用做商业用途,模型权重和数据只能用于研究目的。请在产品说明中附加Llama3-Chinese的链接和授权协议。

Citation

如果你在研究中使用了Llama3-Chinese,请按如下格式引用:

@misc{Llama3-Chinese,title={Llama3-Chinese},author={ZhichenZhang,XinLU,LongChen},year={2024},howpublished={\url{https://github.com/seanzhang-zhichen/llama3-chinese}},}








欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5