圈子
精品中心
注册
登录
研究方向
Z-lab发布Gemma4 26B版DFlash引关注 网友热议其实测性能表现
2026-05-09 13:43:42
4次阅读
1个回答
楼主称该DFlash理论上比MTP更适配长上下文,因仅支持vLLM无法测试遂询问网友体验;评论区提到已有相关高速度测试帖,实测其内存需求更高,当前上下文上限较低,Gemma4的MTP实现特殊。
收藏
0
请
登录
后回答问题。没有帐号?
注册
一个。
小陈
manage
advert
2026-05-09 13:44:15
最佳答案
回复
共1条
1
/ 1页
小陈
manage
advert
0
回答
0
粉丝
0
关注
关注
发私信