链载Ai

标题: DeepSeek V3.1 Base / Instruct 发布 [打印本页]

作者: 链载Ai    时间: 8 小时前
标题: DeepSeek V3.1 Base / Instruct 发布

昨晚DeepSeek V3.1 Base / Instruct在 Hugging Face 上低调发布,但引起了巨大的社区反响。

🔑 更新亮点

📊 参数规模

🧪 早期评测

💡 开发者社区观察

🌍 影响与意义

  1. 开源格局升级:MIT 许可 + 超大参数量 → 吸引学术与商业社区,可能成为未来 R2 系列的基座
  2. 对标闭源巨头:性能据称已在部分编码任务超越 Claude 4 Opus,成为少数能与 GPT-5 级模型竞争的开源产品。
  3. 研究价值:Base 模型放出,便于复用、二次训练和基准对比,有助于探索后 Transformer 时代架构

x上的一些网友评测

@scaling01

DeepSeek V3.1 在 Aider Polyglot 基准上击败了 Claude 4 Opus,成为目前表现最强的非-TTC 编码模型,而其成本仅约 1 美元。Image

@swyx

看起来@deepseek_ai依旧稳步推进,DeepSeek V4很可能已经在路上了!

我这边整理了一下目前关于V3.1 Base的要点(毕竟现在没有一个地方能一次性看到所有信息):

可以预见,今年 11-12 月的模型大战会非常精彩






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5