Reddit热议!Zai用新网络架构让AI推理成本降33%、性能反升15%
2026-05-29 06:07:59
5次阅读
2个评论
Zai将千卡集群的GLM-5.1推理网络从ROFT升级为自研ZCube,彻底移除Spine层,成本降33%、吞吐量升15%、首Token延迟降40.6%。网友称赞其开源精神,批评OpenAI闭源;技术讨论聚焦PD分离推理下的流量不对称问题,认为ZCube通过扁平化拓扑解决了ROFT的拥塞瓶颈。
0
0
2026-05-29 06:08:32

回复 |
引用
2026-05-29 06:09:01

回复 |
引用
共2条
1