ExLlamaV3多项重大更新落地推理性能猛增引本地LLM社区热议

2026-05-12 03:27:32

104次阅读

3个评论

开发者Turboderp近期推出ExLlamaV3多轮更新，含Gemma4支持、DFlash推理加速、量化优化等，社区热议其不支持CPU卸载、内存溢出，及量化精度、硬件适配、TabbyAPI优化等问题，不少用户认可其低比特量化质量。

收藏 0 赞 0

小陈 manage advert

2026-05-12 03:28:05

小陈 manage advert

2026-05-12 03:28:34

小陈 manage advert

2026-05-12 03:29:02

共3条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert