Reddit热议!Strix Halo MTP实测:27B模型生成速度翻倍,35B表现不一
2026-05-17 23:50:50
21次阅读
3个评论
Reddit用户实测显示,在Strix Halo平台启用MTP后,27B模型生成速度提升111%,但35B模型因预填开销过大导致端到端反而变慢。网友指出MTP对代码/数学任务加速明显,但会降低提示处理速度并增加显存占用,多轮对话场景下27B-MTP可节省26%时间。
0
0
2026-05-17 23:51:23

回复 |
引用
2026-05-17 23:51:51

回复 |
引用
2026-05-17 23:52:21

回复 |
引用
共3条
1