一、结论&建议这两天DeepSeek又发布了一个编程能力更强的V3模型,自媒体圈肯定是又被各种震惊。估计大家也是不可避免的都关注到了,所以我这里给大家提供一些更真实的结论和建议。
1、实测下DeepSeek V3-0324相比此前的版本确实在前端设计能力上取得了很大的进步,设计审美和生成长代码的能力都增强了许多; 2、整体编程能力大致在Claude 3.5到Claude 3.7之间 3、目前Cursor中的DeepSeek V3还不是最新版本,但预计很快会接入,不需要花很多时间整自己的API接入方式,价值不大 4、现在使用DeepSeek V3-0324最方便的方式就是DeepSeek官网,可以在一些简单的,只需要少数几个代码文件的任务场景下使用,比如生成app原型,生成简单的html网页等。
二、DeepSeek V3-0324模型跑分按DeepSeek官方发布的说法是: 新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。
可以看出从跑分来说,DeepSeek V3-0324确实开始明显领先了,甚至在评估代码能力的LiveCodeBench上超过了Claude 3.7,不过我在之前的文章中:https://t.zsxq.com/Jpher 就和大家提过,现实世界软件工程要解决的问题和编程竞赛类的跑分是不同的,我们真正该关注的两个评测集其实是SWE-Lancer和SWE-Bench Verified,只有这两个集合的评估才真正代表模型的编程能力。可惜这次V3的发布没有这个数据。
三、实际的测试
这两天DeepSeek的编程能力测试很多,有一个小球在六边形里滚动的,那个其实价值一般,还是让模型解决难题。我觉得更有价值的还是让模型能前端页面和完成后端的开发。所以我还是拿了之前尝试过对模型能力要求比较高的app原型测试的提示词,并做了些调整,去要求deepseek一次性生成全部html代码。 我想开发一个类似拼多多的电商平台app,现在需要输出高保真的原型图,请通过以下方式帮我完成所有界面的原型设计,并确保这些原型界面可以直接用于开发:1、用户体验分析:先分析这个App的主要功能和用户需求,确定核心交互逻辑。2、产品界面规划:作为产品经理,定义关键界面,确保信息架构合理。3、高保真UI设计:作为UI设计师,设计贴近真实iOS/Android设计规范的界面,使用现代化的UI元素,使其具有良好的视觉体验。4、HTML原型实现:使用HTML+TailwindCSS(或Bootstrap)生成所有原型界面,并使用FontAwesome(或其他开源UI组件)让界面更加精美、接近真实的App设计。拆分代码文件,保持结构清晰:5、将所有页面直接平铺展示在index页面中,而不是跳转链接。-真实感增强:-界面尺寸应模拟iPhone15Pro,并让界面圆角化,使其更像真实的手机界面。-使用真实的UI图片,而非占位符图片(可从Unsplash、Pexels、Apple官方UI资源中选择)。-添加顶部状态栏(模拟iOS状态栏),并包含App导航栏(类似iOS底部TabBar)。请按照以上要求生成完整的HTML代码,并确保其可用于实际开发。 这个提示词获得了1400多行的代码,但是因为生成的代码文件过长,deepseek在生成时中断过一次,但点击「继续生成」就解决了。 获得的实际效果如下:     
另外,我还尝试了个网站的生成,效果也还可以,大致都是属于Claude 3.5到Claude 3.7之间的水平。 |