消费级显卡运行通义千问3.6-35B-A3B速度优化分享
2026-04-19 19:30:47
0次阅读
0个评论
楼主分享了在RTX 5070Ti+9800X3D上优化Qwen3.6-35B-A3B运行的方案,修正了传统--cpu-moe参数浪费显存速度的问题,经Reddit社区多次迭代优化,最终实现128K上下文近98t/s的生成速度,还给出不同配置的参考设置和LM Studio适配参数,获社区认可。
收藏 0 0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注