Reddit热帖:Gemma 4 QAT 31B在KV缓存量化上表现更佳
2026-06-23 04:34:44
31次阅读
2个评论
Reddit用户测试发现,经过量化感知训练(QAT)的Gemma 4 31B模型,在KV缓存量化至Q8_0时,输出与BF16基线几乎无差异,可将缓存内存减半且质量稳定。网友解释,QAT降低了权重幅值,使量化精度损失更小。
收藏 0 0
    小陈 manage advert
    2026-06-23 04:35:17
    回复 |  引用
    小陈 manage advert
    2026-06-23 04:35:46
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注