智谱发布Infra新成果:不加一块GPU 算力多出15%

经观智讯2026-05-21 11:30

经济观察网 据科创板日报消息,今日,智谱正式公布已在生产环境完成验证的新型推理集群组网架构 ZCube。该架构在不新增GPU、不更换服务器、不修改代码的前提下,实现集群推理吞吐提升 15%,首Token响应尾延迟(TTFT P99)下降 40.6%。交换机与光模块硬件成本减少三分之一。这意味着,未来大规模 AI 集群的组网采购中,对高端交换机的需求有望向“更少层级、更大端口密度”演进,对光模块的需求则将向更高速率集中。