4月8日,智谱正式发布旗舰开源模型GLM-5.1。
相较上一代模型,新版本在“长程任务”(Long-Horizon Task)能力上实现显著突破,能够在单次任务中连续工作超过8小时,并最终交付工程级成果,标志着大模型正从辅助工具向生产力工具进一步演进。
在商业化层面,智谱的增长同样亮眼。财报显示,2025年公司MaaS(模型即服务)API平台实现年化收入(ARR)达17亿元,同比增长60倍,毛利率提升至18.9%。
随着GLM-5系列发布,模型已获得包括字节跳动、阿里巴巴、腾讯在内的头部厂商接入,中国十大互联网公司中已有九家实现深度集成。
伴随模型能力提升,智谱也持续推进价格调整。继此前两次提价后,GLM-5.1再次上调Token价格约10%。
对于涨价原因,智谱CEO张鹏表示,一方面受限于算力供给瓶颈,另一方面更关键在于模型能力带来的价值提升。当模型能够替代更多人力、显著提升效率时,高质量算力资源本身具备稀缺性和定价权。
基于这一逻辑,智谱提出“Token分层”理念:面向简单对话和轻量任务的低阶Token将趋向低价甚至免费,而具备高复杂度、高可靠性的高阶Token,则因其生产力属性具备持续溢价能力,而这一切建立在模型能力持续进化的基础之上。
在技术评测方面,GLM-5.1表现同样突出。在SWE-Bench Pro、Terminal-Bench 2.0以及NL2Repo三大代码评测基准的平均成绩中,模型位列全球第三、国产第一、开源模型第一,展现出较强的软件工程能力。
智谱认为,下一阶段衡量大模型的标准将是“能工作多久”,即模型在长程任务中的表现——要保持稳定输出,模型面对的不只是更大代码量,还有一连串复杂的工程决策点:主动跑Benchmark、定位瓶颈、修改方案、再跑测试。这需要模型像人类工程师一样,形成“实验到分析再到优化”的完整闭环,而不是写完代码停下来等人打分。





