- 小陈 发表时间:2026-05-31 09:38:48 最新回复:2026-05-31 09:39:49
Reddit热议!英伟达NVFP4量化版Qwen模型性能如何? Qwen 推理部署 研究方向 国内模型
2
2
- 小陈 发表时间:2026-05-31 03:02:55 最新回复:2026-05-31 03:04:25
双4060Ti跑Qwen3.6达125 tok/s,性价比碾压高端迷你主机 Qwen 推理部署 研究方向 国内模型
3
3
- 小陈 发表时间:2026-05-28 14:15:11 最新回复:2026-05-28 14:16:42
Reddit热议!Q4升Q6后本地编码AI质量飙升,老外怎么看? Qwen 推理部署 研究方向 国内模型
8
3
8
3
- 小陈 发表时间:2026-05-27 20:00:49 最新回复:2026-05-27 20:01:51
Reddit热帖:本地LLM自我优化循环,性能从30%飙升至90%! 推理部署 研究方向 技术工具
8
2
20
3
- 小陈 发表时间:2026-05-25 19:38:11 最新回复:2026-05-25 19:39:13
Reddit热议!老外用V100显卡跑出1000 tps生成速度 Qwen 推理部署 研究方向 国内模型
12
2
- 小陈 发表时间:2026-05-25 14:26:50 最新回复:2026-05-25 14:27:23
Reddit热议!AMD RDNA3用户福音:开源推理引擎hipEngine性能炸裂 推理部署 研究方向
13
1
- 小陈 发表时间:2026-05-23 15:21:39 最新回复:2026-05-23 15:23:10
BeeLlama v0.2.0 发布:RTX 3090 上 Qwen 27B 跑出 164 tps,速度提升 4.4 倍! 推理部署 研究方向
11
3
- 小陈 发表时间:2026-05-22 01:38:04 最新回复:2026-05-22 01:39:34
Reddit热议!12GB显存跑35B模型飙到110 tok/s,老外怎么做到的? 推理部署 研究方向
15
3
16
3
- 小陈 发表时间:2026-05-19 17:35:46 最新回复:2026-05-19 17:37:17
24GB显存跑Qwen 27B终极指南:ik_llama.cpp+MTP量化封神 Qwen 推理部署 研究方向 国内模型
57
3
- 小陈 发表时间:2026-05-17 23:50:50 最新回复:2026-05-17 23:52:21
Reddit热议!Strix Halo MTP实测:27B模型生成速度翻倍,35B表现不一 推理部署 研究方向
22
3
21
3
21
3
- 小陈 发表时间:2026-05-16 16:17:03 最新回复:2026-05-16 16:18:34
本地运行Qwen 3.6 MTP模型:300K上下文实测与性能飞跃 Qwen 推理部署 研究方向 国内模型
61
3
- 小陈 发表时间:2026-05-15 11:13:31 最新回复:2026-05-15 11:15:02
首次装机小白实测:RTX 5000 PRO 48GB显存性能惊艳 Qwen 推理部署 研究方向 国内模型
16
3
21
3
- 小陈 发表时间:2026-05-14 19:16:11 最新回复:2026-05-14 19:17:42
Qwen+MTP本地跑出34t/s,性能飙升40%引热议 Qwen 推理部署 研究方向 国内模型
20
3
- 小陈 发表时间:2026-05-14 11:20:57 最新回复:2026-05-14 11:21:59
DramaBox:基于LTX 2.3的最具表现力开源语音模型,支持语音克隆 推理部署 研究方向 技术工具
18
2
19
3