|
Claude Opus 4和Claude Sonnet 4Gemini2.5 Pro的编程王座还没坐热乎,就又被反超了...同时,Claude Opus 4 和 Sonnet 4 是混合模型有两种工作模式:几乎实时的快速回复,以及进行深度思考的扩展模式。这两种模式都能在推理过程中灵活切换使用各种工具(比如网络搜索),从而提高回答质量和准确性。 在衡量模型解决实际软件问题能力的SWE-bench Verified基准测试中,Claude 4两款模型都达到了顶尖水平。 Claude Opus 4甚至能够在复杂、耗时较长的任务中持续工作数小时,这极大地拓展了Agent能够完成的工作边界。 下面这个视频展示了Claude团队如何使用Claude4帮助提效的,值得一看同时,我发现Cursor也是真特么神速,Claude4才上线一个小时,就已经被集成进去了我家有22只猫,我想让AI帮我生成一个展示猫咪信息的网页,页面是可爱、简约风,要精美,要包含猫咪的各种基本信息
最后一个大鱼吃小鱼的游戏,让我挺惊艳的,一次搞定,而且可玩性还有体验上来说,甚至比Skywork吭哧吭哧10多分钟生成出来的更好体验了几个Case,个人觉得Claude sonnet 4确实在代码方便有比较明显的提升,而且更稳定了,生成高质量网站的概率变高了。我之前试过Claude3.5和3.7想生成3D网页,是非常不稳定的,基本很难生成出来 |