在开发针对特定细分场景的AI应用时,我们需要对备选模型在这些场景下的性能进行细致的测试,以确定模型的能力边界,才能知道这个模型是否真的适合用在这个场景上。
而当前,不管是开源或者闭源模型,模型更新的速度很快,几乎每天都有新的模型版本发布。
为了提升模型实测环节的效率,SOTA平台每日会更新包括Llama3、Yi-1.5、DeepSeek等在内的最新热门开源模型的实测案例,作为大家了解模型实际能力的基础。
我们的测试案例会涵盖代码、逻辑与推理、角色扮演、内容生成与创作等常见应用场景。
今日实测
下面是Qwen1.5-MoE-A2.7B在代码生成、文本创作、JSON格式提取、信息提取的表现展示(附上模型部署环境、推理效率)。Qwen1.5-MoE-A2.7B采用混合专家 (MoE) 架构,其中的模型由密集语言模型升级而来,Qwen1.5-MoE-A2.7B是从升级而来Qwen-1.8B。它总共有143亿个参数,运行时有27亿个激活参数。
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |