Qwen+MTP本地跑出34t/s，性能飙升40%引热议

2026-05-14 19:16:11

86次阅读

3个评论

用户通过TurboQuant和MTP技术，在MacBook Pro M5 Max上实现Qwen模型34 tokens/s的推理速度，性能提升40%，接受率达90%。但评论区争议激烈：部分网友质疑TurboQuant实际效果不如Q4量化，甚至导致模型质量下降；也有用户指出速度提升依赖硬件和任务类型，MTP才是真正亮点。此外，多篇类似帖子被指为推广营销。