近日,智谱公司正式发布并开源了新一代大模型GLM-5,在编程与智能体(Agent)能力领域取得了重大突破。该模型在全球权威评测榜单Artificial Analysis中位居开源模型之首,全球排名第四,其真实场景下的编程体验已接近行业标杆Claude Opus 4.5,尤其在复杂系统开发与长程任务执行方面展现出显著优势。
在技术架构方面,GLM-5通过三项核心创新构建了强大的能力基础:参数规模从3550亿(激活320亿)扩展至7440亿(激活400亿),预训练数据量增长24%至28.5TB;全新研发的"Slime"异步强化学习框架支持超大规模模型训练,并配合异步智能体算法实现长程交互学习;首次集成的DeepSeek稀疏注意力机制,在保持长文本处理能力的同时,降低了40%的部署成本。这些升级使得GLM-5在SWE-bench-Verified和Terminal Bench 2.0基准测试中分别取得了77.8和56.2的高分,超越了Gemini 3 Pro等竞品。
在智能体能力方面,GLM-5创造了多项开源纪录:在BrowseComp(联网信息理解)、MCP-Atlas(多工具任务执行)和τ²-Bench(复杂场景规划)评测中均获得第一;在模拟自动售货机经营的Vending Bench 2测试中,其账户余额达到4432美元,经营策略与Claude Opus 4.5持平。这些能力使得模型具备了真正的Agentic Ready特性,能够自主完成目标保持、资源管理和多步骤依赖处理等复杂任务。
在实际应用场景中,GLM-5已经展现出了强大的生产力价值。开发者利用该模型开发出横版解谜游戏、论文版"抖音"等可上线应用,相关案例已收录至官方案例库;通用助手OpenClaw接入GLM-5后,可实现网站搜索、资讯整理、代码编写等7×24小时自动化服务;全新推出的Z Code编程平台支持需求拆解、多智能体协作、调试部署全流程,用户甚至可通过手机远程指挥桌面端完成工程任务。在办公领域,该模型可直接将文本素材转换为docx、pdf、xlsx等格式文件,支持生成产品需求文档、教案、财务报表等复杂文档。
值得关注的是,GLM-5的线上服务得到了国产芯片集群的强力支撑。目前该模型已完成与华为昇腾、摩尔线程、寒武纪等7家国产算力平台的深度适配,通过底层算子优化实现了高吞吐、低延迟的运行。为应对GLM Coding Plan的全球需求爆发,官方同步升级服务套餐:Max用户即刻可用,Pro用户将在5日内获得支持,并推出AutoGLM-OpenClaw飞书集成、Excel原生插件等专属权益。
该模型现已在Hugging Face和ModelScope平台开源,采用MIT License协议。此次发布标志着大模型技术从"代码生成"向"工程交付"的关键跃迁,其开源策略将加速Agentic Engineering生态的构建与发展。


