链载Ai

标题: 全面的大模型训练、推理工具包LLMBox来了! [打印本页]

作者: 链载Ai    时间: 2025-12-2 09:47
标题: 全面的大模型训练、推理工具包LLMBox来了!
在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》,目前已经更新到第13个版本,自上线以来受到了不少读者的关注。在几周之前,我们完成了中文版书籍《大语言模型》的初稿。中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。


英文综述链接:

https://arxiv.org/abs/2303.18223

中文书项目链接:

https://llmbook-zh.github.io



作为《大语言模型》综述和书籍的配套资源,我们开发了一个代码工具库LLMBox,供研究人员使用。LLMBox代码库包含统一的训练流程和全面的模型评估框架,旨在成为训练和使用大语言模型的一站式解决方案。




工具库链接:


https://github.com/RUCAIBox/LLMBox


LLMBox内部集成了许多实用的功能,实现了训练和使用阶段高度的灵活性和效率。比如在训练阶段,我们支持预训练、指令微调、对齐微调等训练策略,高效数据处理策略和统一的数据集混合等功能;在使用阶段,我们有全面的评测模型和数据集支持、常见评测设置、高效评测等功能。在接下来的一段时间,我们还会发出十余期LLMBox的详细使用教程,涵盖从入门到进阶的大模型训练和使用方法,以帮助读者加深实践经验。




训练部分




使用部分



接下来的几期推送将先介绍评测和使用部分,从国内下载模型开始,到如何加速实验、量化推理,再到如何用LLMBox复现论文中常见的评测基线,包括CoT、ICL等策略。



然后是用LLMBox训练模型的部分,从训练模型前的高效训练配置、显存估计和词表扩充,到四种模型训练策略的详细使用指导(PT、SFT、PPO和DPO),其中还包括参数高效微调使用介绍,再到使用LLMBox进行大模型指令生成,包括Evol-instruct和Self-instruct两种策略。




如果在使用中遇到相应的问题或者不完善的功能,欢迎在GitHub Issue
(https://github.com/RUCAIBox/LLMBox/issues)中反馈!

LLMBox往期回顾


大模型综述出书了

2024-04-15



大模型综述11月最新升级

2023-11-27







欢迎光临 链载Ai (http://www.lianzai.com/) Powered by Discuz! X3.5