单RTX5090跑Qwen3.6-27B-INT4破百TPS引Reddit热议 - 求真求是网

单RTX5090跑Qwen3.6-27B-INT4破百TPS引Reddit热议

2026-04-27 04:53:09

144次阅读

0个评论

楼主分享用vLLM 0.19在单RTX5090上跑Lorbus量化的Qwen3.6-27B-INT4，256k上下文达105-108TPS；评论区有3090跑通案例、16G显存难撑的反馈，还讨论量化质量、配置优化建议。

收藏 0 赞 0

请登录后评论。没有帐号？注册一个。

manage advert

0 回答
0 粉丝
0 关注

相关帖子