热搜: 活动交友 discuz

扫码关注官方微信

扫码下载APP

返回顶部

链载Ai › 核心板块 › 前沿技术 › 刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型 ...

链载Ai 关注Ta

发帖数25603
粉丝0

此人很懒，什么也没有留下

阅读作者更多精彩帖子

热门问答更多热门问答

技术文章更多技术文章

刚刚，DeepSeek开源新版R1，媲美OpenAI最高o3模型

[复制链接]

链载Ai 显示全部楼层 发表于 4 小时前 |阅读模式

上一主题

下一主题

今天凌晨，全球著名开源大模型平台DeepSeek开源了R1最新0528版本。

DeepSeek目前没有对该版本进行任何说明，又只是“悄悄”地开放了模型。估计很快会放出模型卡介绍更多功能。

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

但已经有网友迫不及待的对新版R1进行测试，在著名代码测试平台Live CodeBench中显示，其性能可以媲美OpenAI最新的o3模型高版本。

也有网友对新版R1的风格进行了测试，几乎和OpenAI的o3差不多。

R1-05-28具有o3-2.5专业风格的响应。箭头/星号的使用与o3风格非常一致，结尾处“why it works”的表述更具说服力。

尽管OpenAI付出了努力，但DeepSeek依然出色地完成了这一点。如果这就是o3水平，那么R2将会有多智能呢？

Hyperbolic Labs联合创始人兼首席执行官表示，新版R1仍然是唯一能回答9.9和9.11哪个最大的模型。

知名AI评论、分享人Haider表示，大师兄DeepSeek又回来了~

新版本的DeepSeek R1在编程方面简直令人难以置信。

我进行了一项编程挑战，要求模型构建一个单词评分系统。模型短暂推理后，给了我两个文件：整洁的代码和可运行的测试用例。两者第一次运行就完美通过。

此前只有o3模型能做到这一点，但现在没有其他模型能做到了。这是我在这项任务中测试过的最佳模型。

我一直在测试它，它非常智能，但现在似乎思考时间更长了。

如果这能被其他基准测试证实，我可以想象原本DeekSeek是想把新版R1作为R2发布的，但鉴于最近发布的产品已经远远领先，若再用R2这个标签可能会让人失望。

因此，他们可能决定将其作为新的R1版本发布。那么唯一的问题就是，我们还要等多久才能看到真正的R2呢。

新的DeepSeek R1实际上相当不错。它现在能够像o3一样纠正自己的思维链（CoT），并能像Claude一样创造性地构建世界观。这在之前的R1版本中是做不到的。

看到新版R1的编程能力这么好，我很震惊。用同样的提示测试了最新的Opus 4，结果Opus 4只是稍好一点。这太可怕了……

在DeepSeek放出官方模型卡之后，「AIGC开放社区」会为大家做更深的解读。

本文素材来源网络，如有侵权请联系删除ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 12px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);visibility: visible;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;color: rgb(34, 34, 34);background-color: rgb(255, 255, 255);line-height: 1.75em;text-align: center;">END

回复

使用道具举报

发布主题

返回列表

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程，Suno AI音乐生成指南，以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整，手把手助您从入门到精通。

官方手机版
微信公众号
商务合作

Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司||