Z-lab发布Gemma4 26B版DFlash引关注 网友热议其实测性能表现
2026-05-09 13:43:42
4次阅读
1个回答
楼主称该DFlash理论上比MTP更适配长上下文,因仅支持vLLM无法测试遂询问网友体验;评论区提到已有相关高速度测试帖,实测其内存需求更高,当前上下文上限较低,Gemma4的MTP实现特殊。
收藏 0

登录 后回答问题。没有帐号? 注册 一个。

    小陈 manage advert
    2026-05-09 13:44:15
    最佳答案
共1条 1

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注