Reddit热帖：Gemma 4 QAT 31B在KV缓存量化上表现更佳

2026-06-23 04:34:44

31次阅读

2个评论

Reddit用户测试发现，经过量化感知训练（QAT）的Gemma 4 31B模型，在KV缓存量化至Q8_0时，输出与BF16基线几乎无差异，可将缓存内存减半且质量稳定。网友解释，QAT降低了权重幅值，使量化精度损失更小。

收藏 0 赞 0

小陈 manage advert

2026-06-23 04:35:17

小陈 manage advert

2026-06-23 04:35:46

共2条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert