|
GLM 4.7发布了,从客观数据看,编程方面进步很大。 智谱可能是国内最早打“平替Claude”牌的AI厂商了,对于智谱的新模型,我也毫不犹豫用Claude Code来测试,看看这次平替能力是否进步了。 先说结论: 我把Claude Code换成 GLM-4.7 用了6小时,竟然没发现明显区别,最明显的区别是省钱了。 省流版 前端能力进步很大,审美极强。 用GLM-4.7驱动Claude Code,中等难度以下任务,几乎感觉不到和原版有区别。高难度任务(如:需要反复压缩上下文跨越多个上下文窗口的情况),能够看出来有区别,相比Claude Code原版更容易健忘。 有点难以置信:在LMARENA的WebDev盲测榜中,GLM-4.7位列全球第六,甚至超过了GPT-5.2。 GLM-4.7是开源的,史上编程能力最强的开源模型!老外一定会深感震撼,按照某些美国明星科技企业的秉性,稍后等他们一起床,就会开始套壳了。 GLM Coding Plan 20人民币/月的套餐 值得购买,下文有二维码。 小遗憾:暂时不是多模态(可以通过MCP来补);上下文长度200K,属于中等长度。
下面我们稍微展开讲讲。 如何在Claude Code里使用GLM 4.7? 这里点赞一下智谱官方的贴心和专业。无论是Claude Code、还是Cline、Droid,所有开发者常用的工具,官方都做了教程。 https://docs.bigmodel.cn/cn/coding-plan/tool/claude-for-ide
我同时在Claude Code IDE插件、 Claude Code CLI、Droid、Cline里设置了GLM 4.7。四个方式我都感受了,我认为是在Claude Code IDE插件/Claude Code CLI里,GLM 4.7的体验最好。
前端能力进步很大 在前两个月,但凡Google/OpenAI/Anthropic发布了新的模型,都会引入一个“金门大桥测试”。 这个测试非常难,以前用国产模型做,效果都不太好。因为这个任务还挺难的,是一个综合性特别强的任务,包括需要有世界知识、需要有物理知识、需要3D细节、可交互镜头、雨天地面湿润反光等等。 GLM-4.7很争气,一次搞定。 不过,可能是因为这个任务太难了,第一次做出来的时候,性能不是特别好。我再额外和GLM-4.7单聊了一会儿优化性能的事。 下面请欣赏, GLM-4.7完成的金门大桥。 怀疑作弊?我没有作弊,你可以复现!我来公布原始Prompt,你使用这一段Prompt,发给GLM-4.7,你也能得到同样的效果! 震不震惊? ObjectiveBuildavisuallystunning,high-fidelity3Dvoxel-stylesimulationoftheGoldenGateBridgeinThree.js.Prioritizecomplexvisuals(notsimpleblocks),strongatmospheredepth,andsmooth~60FPS.Visuals&Atmosphere-Lighting:aTime-of-dayslider(0–24h)thatcontrolssunposition,intensity,skycolor,andfogtint.-Fog:volumetric-feelingfogusinglightweightspriteparticles;slider0–100(0=crystalclear,100=densebutnotpurewhiteout).-Water:customshaderforwaves+specularreflections;blendhorizonwithdistance-basedfog(exp2)sothefarwatermergesnaturally.-Post:ACESfilmictonemapping+optimizedbloom(nightlightsglowbutkeepperformance).SceneDetails-Bridge:recognizableart-decotowers,mainspancables+suspenders,piers/anchorsconsistentwithsuspensionbridgestructure.-Terrain:simplebutconvincingMarinHeadlands+SFsidepeninsulasilhouettes.-Skyline:procedural/instancedcityblocksontheSFsidetosuggestdepth.-Traffic:upto~400carsviaInstancedMesh,properlyalignedonthedeck(avoidclipping).Headlights/taillightsemissiveatnight.-Ships:afewproceduralcargoshipswithnavigationlightsmovingacrossthebay.-Nature:asmallflockofanimatedbirds(lightweightflocking).NightModeAtnight,enablecitylights,bridgebeacons,streetlights,vehiclelights,shipnavlights.Tech&Controls(Important)-OutputMUSTbeasingleself-containedHTMLfile(e.g.,golden_gate_bridge.html)thatrunsbyopeninginChrome.-Nobuildtools(noVite/Webpack).PureHTML+JS.-ImportThree.jsandaddonsviaCDNusingESModules+importmap.-UI:nice-lookingslidersforTime(0–24),FogDensity(0–100),TrafficDensity(0–100),CameraZoom.-Optimization:useInstancedMeshforrepeateditems(cars/lights/birds),avoidheavygeometry,keepdrawcallslow.
我们也可以顺便复习一下GPT-5.1的金门大桥。 是不是已经区别不大了?
LMARENA的WebDev盲测榜位列第六 这可能是为数不多、不能刷的榜之一了。 为什么?因为它没有标准答案,它是基于大规模的用户进行双盲测试。 在WebDev分类排名,在我印象中,似乎还没有国产模型排名如此靠前过,何况GLM-4.7还是个开源模型。 用GLM 4.7平替Claude Code,中等难度以下任务无感 我们一直在期待“无感平替” 我们先简单闻闻味儿 —— 下面两个图,你能看出这是GLM 4.7吗? 我用了一下午都没看出来!我以为它是原生的Claude Sonnet模型呢,无论是行文风格、代码逻辑、情绪价值,都很像。
用GLM 4.7平替Claude Code,哪种任务会感觉有区别? 经过不断上难度测试,我发现,当我们遇到「需要跨越很多个上下文窗口」的复杂任务的时候,能够看出来GLM 4.7是略逊于最顶级模型的,有点小遗憾。 具体表现是:对于超复杂的长程任务,即便是事先写了特别长的文档,GLM-4.7也会偶发健忘,需要提醒。 这是因为,Claude Sonnet 4.5、Claude Opus 4.5、GPT-5.2-Codex等等2025年9月以后出现的最顶级编程模型,都训练“原生长程能力”,能够更好的跨越多个上下文窗口。因此,你可能之前看到过有人提到,用这几款模型,能够“自己卷自己好几个小时”。国产模型在这方面的能力,还没有赶上,相信不远的将来(也许3个月内)就会赶上! 好在,这样的任务并不多见,就算遇到了偶发健忘,也可以稍微多聊两句提醒提醒。 GLM 4.7 是目前国内最“无感平替”的Claude Code平替了。
如何在补齐GLM-4.7的多模态能力、联网搜索能力? GLM包月套餐里提供了联网搜索、多模态能力,作为MCP接入。 详见这里
https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server
以视觉理解为例,在命令行里执行一句命令,就添加好了 claudemcpadd-suserzai-mcp-server--envZ_AI_API_KEY=your_api_key--npx-y"@z_ai/mcp-server" 不仅可以看懂图片,还能分析视频内容呢。 |