智谱首次披露GLM-5 Coding Agent推理工程实践

经观智讯2026-04-30 09:00

经济观察网 据科创板日报消息，4月30日凌晨，智谱发布技术博客，首次系统披露GLM-5系列模型在超大规模Coding Agent调用场景下的底层推理技术突破。包括系统吞吐最高提升132%，相同硬件条件下服务能力的显著扩容。KV cache 修复方案（改进了模型在长对话中的记忆缓存机制，从而提升推理效率）获SGLang开源社区采纳。此外，公司推理优化还在进一步加速，大幅提升单位算力token吞吐效率，降低推理成本。

热新闻

回扣入刑，医生和药企慌了
伟伟道来 | 伊朗为什么越来越强硬
《中国投资发展报告（2026）》：A股有望继
“心机”之害与品牌之殇
金融产品网络营销新规落地，平台、机构、主
专访价格学者龙少波：“好的通胀”和“坏的
坚守算电双核顶层战略协鑫能科以“AI基建
存储“黑马”香农芯创董事长黄泽伟：2028年
今日看点｜国新办将举行国务院政策例行吹风
当“指数增强”变成“赛道赌注”：超额收益

视频推荐

比亚迪部分车型天神之眼B辅助驾驶激光版选装价上涨2100元

五篇大文章的阳光答卷

伟伟道来｜第三次交手

电子刊物

点击进入

用户名登录/手机号登录 还没有账号？免费注册

智谱首次披露GLM-5 Coding Agent推理工程实践

热新闻

视频推荐

电子刊物

用户名登录/手机号登录

还没有账号？免费注册