返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA[1] LORA [2] 的训练方法

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 09:32 |阅读模式 打印 上一主题 下一主题

ingFang SC", BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif;font-size: 14px;letter-spacing: normal;text-wrap: wrap;">


介绍

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">Llama3-Chinese以Meta-Llama-3-8B为底座,使用DORA[1]+LORA+[2]的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">Github:https://github.com/seanzhang-zhichen/llama3-chinese

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;letter-spacing: 0.1em;">

ingFang SC", BlinkMacSystemFont, Roboto, "Helvetica Neue", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.2em;display: table;border-bottom: 1px solid rgb(248, 57, 41);">模型下载

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 15px;background: rgba(0, 0, 0, 0.05);">
ModelDownload
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">Meta-Llama-3-8BingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">? HuggingFace[3]? ModelScope[4]
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 11.2px;border-color: rgb(223, 223, 223);">Llama3-Chinese-Lora? HuggingFace[5]? ModelScope[6]
Llama3-Chinese (合并好的模型)? HuggingFace[7]? ModelScope[8]

合并LORA模型(可跳过)

1、下载Meta-Llama-3-8B[9]

gitclonehttps://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B.git

2、下载Llama3-Chinese-Lora[10]

From ModelScope

gitlfsinstallgitclonehttps://www.modelscope.cn/seanzhang/Llama3-Chinese-Lora.git

From HuggingFace

gitlfsinstallgitclonehttps://huggingface.co/zhichen/Llama3-Chinese-Lora

3、合并模型

pythonmerge_lora.py\--base_modelpath/to/Meta-Llama-3-8B\--lora_modelpath/to/lora/Llama3-Chinese-Lora\--output_dir./Llama3-Chinese

下载 Llama3-Chinese(合并好的模型)

From ModelScope

gitlfsinstallgitclonehttps://www.modelscope.cn/seanzhang/Llama3-Chinese.git

From HuggingFace

gitlfsinstallgitclonehttps://huggingface.co/zhichen/Llama3-Chinese

vllm web 推理

1、使用vllm[11]部署模型

python-mvllm.entrypoints.openai.api_server--served-model-nameLlama3-Chinese--model./Llama3-Chinese(换成你自己的合并后的模型路径)

2、在命令行执行

pythonvllm_web_demo.py--modelLlama3-Chinese

训练数据集

匠数科技大模型sft数据集[12]

LICENSE

本项目仅可应用于研究目的,项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。详细请参考免责声明[13]

Llama3-Chinese项目代码的授权协议为The Apache License 2.0[14],代码可免费用做商业用途,模型权重和数据只能用于研究目的。请在产品说明中附加Llama3-Chinese的链接和授权协议。

Citation

如果你在研究中使用了Llama3-Chinese,请按如下格式引用:

@misc{Llama3-Chinese,title={Llama3-Chinese},author={ZhichenZhang,XinLU,LongChen},year={2024},howpublished={\url{https://github.com/seanzhang-zhichen/llama3-chinese}},}



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ