链载Ai
标题:
重磅发布!GLM-4.6正式上线,200K上下文窗口开启智能新纪元
[打印本页]
作者:
链载Ai
时间:
3 天前
标题:
重磅发布!GLM-4.6正式上线,200K上下文窗口开启智能新纪元
2025年9月30日,智谱AI正式发布了其新一代旗舰大模型GLM-4.6。此次发布标志着该模型系列迎来了一次重大升级。
相较于前代产品GLM-4.5,GLM-4.6在多个关键维度实现了显著提升。它将上下文窗口从128K令牌扩展至200K,使其能够处理更为复杂和长程的任务。在代码能力、逻辑推理、智能体(Agent)应用以及文本生成质量方面,新模型也展现出更优越的性能。
官方评测数据显示,GLM-4.6在多项国际公开基准测试中的表现均优于GLM-4.5,并在实际应用中展现出与国际先进模型相竞争的实力。此次发布旨在为开发者与用户提供一个更强大、更高效的人工智能基础模型。
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;text-align: justify;">核心亮点
GLM-4.6 核心亮点总结
更长的上下文处理能力
-上下文窗口从128K大幅提升至
200K令牌
,能够处理和理解更庞大的文档与更复杂的任务链。
卓越的代码能力
-在多项代码基准测试中得分更高,尤其在
前端页面生成
方面表现突出,能制作视觉效果更佳的作品。
-在实际编程体验中,其能力已应用于Claude Code、Cline等多个产品。
强大的推理与工具调用
-逻辑推理能力
显著增强,并能在推理过程中
无缝调用外部工具
,解决复杂问题的能力更强。
更智能的智能体(Agent)
-在
工具使用
和
联网搜索
等智能体应用场景下表现更为强大,能更高效地集成到各类智能体框架中。
更优质的写作与角色扮演
-文本生成更符合人类的
风格与可读性
偏好,在
角色扮演
场景下的表现也更加自然生动。
更高的生成效率
-在实际任务中,完成任务所需的令牌数比GLM-4.5减少了约
15%
,在能力提升的同时实现了更高的效率。
经过严格验证的性能
-在八大公开基准测试中全面超越GLM-4.5。
-在模拟真实工作环境的“CC-Bench”评估中,其表现已接近国际顶尖模型Claude Sonnet 4,并显著优于其他开源模型。所有评估数据已公开。
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;text-align: justify;">模型评测
1.综合评测
在涵盖数学、代码、网页交互、专业学科等领域的8大权威基准(如AIME 2025、SWE-Bench等)的全面检验中,GLM-4.6展现出卓越的通用能力。其综合性能在部分榜单上已达到与国际顶尖模型Claude Sonnet 4/4.5并驾齐驱的水准,并稳居国产模型首位,持续领跑行业。
2.真实编程评测
在真实场景的实践价值超越榜单排名的共识下,研究团队对GLM-4.5的CC-Bench评估体系进行了升级,引入更具挑战性的多维度任务。在隔离的Docker容器环境中,人类评估员与模型协同完成涵盖前端开发、工具构建、数据分析、测试验证及算法设计的复杂多轮任务。评估数据表明,GLM-4.6相较前代模型实现显著进步,与Claude Sonnet 4达到近乎持平的表现(胜率48.6%),并明显优于其他开源基线模型。
从token效率维度观察,GLM-4.6完成任务所需的token数量较GLM-4.5减少约15%,展现出能力与效率的同步提升
欢迎光临 链载Ai (https://www.lianzai.com/)
Powered by Discuz! X3.5