Unsloth发布带MTP层的Qwen3.6模型 社区热议使用问题与进展
2026-05-12 04:13:21
19次阅读
3个评论
Unsloth发布保留MTP层的Qwen3.6系列GGUF模型,需配合llama.cpp的MTP相关PR使用;社区有用户频繁刷GitHub等更新,也反馈模型报错、暂缺并行/视觉支持,还讨论了MTP性能与量化版本,llama.cpp相关基建刚合并。
0
0
2026-05-12 04:13:54

回复 |
引用
2026-05-12 04:14:23

回复 |
引用
2026-05-12 04:14:52

回复 |
引用
共3条
1