1.长上下文扩展
2.改进的策略优化
3.简化框架
架构并不限于vLLM,还可以方便地集成其他框架
由于k1.5是一个多模态模型,研究者对不同模态的各种基准进行了综合评估。基准测试主要包括以下三类:
Text Benchmark:MMLU, IF-Eval, CLUEWSC, C-EVAL
Reasoning Benchmark:HumanEval-Mul, LiveCodeBench, Codeforces, AIME 2024, MATH500
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |