嫁接MTP的Qwen3.6-35B-A3B模型实测结果公布
2026-05-08 08:18:55
32次阅读
2个评论
楼主上传嫁接MTP的Qwen3.6-35B-A3B模型,自测提速有限,称结果为初步性;网友反馈提速幅度受硬件影响差异大,有评论解释MoE模型用MTP提速远不及密集模型的原理,该模型暂不支持mmproj,MTP多占约900MB显存。
0
0
2026-05-08 08:19:28

回复 |
引用
2026-05-08 08:19:57

回复 |
引用
共2条
1
相关帖子
- 实测:12GB显存可流畅运行35B级Qwen 35B-A3B MoE大模型
- 实测Qwen3.6-35B MoE:显存有限时更大量化反而性能更好
- Qwen3.6-35B搭适配代理追平云模型引发社区热议
- Qwen3.6 35B无审查Heretic模型获赞 被称同参数级最佳
- 12GB显存跑Qwen3.6 35B:80tok/s+128K上下文!llama.cpp MTP攻略
- Qwen3.6 27B编码效果超35B MoE引本地AI用户热议
- Unsloth发布Qwen3.6-27B-GGUF模型引网友热议
- 双显卡实测Qwen3.6-27B与Coder-Next:优劣依场景而定
- 通义千问Qwen3.6 27B本地实测表现优异引网友热议
- Qwen3.6-27B搭MTP借未合入PR实现2.5倍吞吐量提升