AI 大模型资源圈

国内外大模型资源分享、技术交流、实用工具、场景应用与资源分类整理。

  • 小陈 发表时间:2026-05-31 15:41:23 最新回复:2026-05-31 15:42:24

Reddit讨论:如何估算大模型每秒生成token数? 推理部署 研究方向

2
2
  • 小陈 发表时间:2026-05-31 09:38:48 最新回复:2026-05-31 09:39:49

Reddit热议!英伟达NVFP4量化版Qwen模型性能如何? Qwen 推理部署 研究方向 国内模型

2
2
  • 小陈 发表时间:2026-05-31 03:02:55 最新回复:2026-05-31 03:04:25

双4060Ti跑Qwen3.6达125 tok/s,性价比碾压高端迷你主机 Qwen 推理部署 研究方向 国内模型

3
3
  • 小陈 发表时间:2026-05-28 14:15:11 最新回复:2026-05-28 14:16:42

Reddit热议!Q4升Q6后本地编码AI质量飙升,老外怎么看? Qwen 推理部署 研究方向 国内模型

8
3
  • 小陈 发表时间:2026-05-28 00:55:38 最新回复:2026-05-28 00:57:09

400美元双RTX 3060跑AI模型,性能竟超7900 XTX? 推理部署 研究方向

8
3
  • 小陈 发表时间:2026-05-27 20:00:49 最新回复:2026-05-27 20:01:51

Reddit热帖:本地LLM自我优化循环,性能从30%飙升至90%! 推理部署 研究方向 技术工具

8
2
  • 小陈 发表时间:2026-05-26 20:38:32 最新回复:2026-05-26 20:40:03

Reddit热议!律师自建16卡V100集群写法律文书 推理部署 研究方向 技术工具

20
3
  • 小陈 发表时间:2026-05-25 19:38:11 最新回复:2026-05-25 19:39:13

Reddit热议!老外用V100显卡跑出1000 tps生成速度 Qwen 推理部署 研究方向 国内模型

12
2
  • 小陈 发表时间:2026-05-25 14:26:50 最新回复:2026-05-25 14:27:23

Reddit热议!AMD RDNA3用户福音:开源推理引擎hipEngine性能炸裂 推理部署 研究方向

13
1
  • 小陈 发表时间:2026-05-24 02:37:07 最新回复:2026-05-24 02:38:37

Reddit热议!8GB显存跑1M上下文,老外怎么做到的? 推理部署 研究方向

13
3
  • 小陈 发表时间:2026-05-24 02:34:48 最新回复:2026-05-24 02:36:18

Reddit热议!16GB显存跑27B大模型,纯量化引争议 推理部署 研究方向

21
3
  • 小陈 发表时间:2026-05-23 15:21:39 最新回复:2026-05-23 15:23:10

BeeLlama v0.2.0 发布:RTX 3090 上 Qwen 27B 跑出 164 tps,速度提升 4.4 倍! 推理部署 研究方向

11
3
  • 小陈 发表时间:2026-05-22 01:38:04 最新回复:2026-05-22 01:39:34

Reddit热议!12GB显存跑35B模型飙到110 tok/s,老外怎么做到的? 推理部署 研究方向

15
3
  • 小陈 发表时间:2026-05-20 17:22:03 最新回复:2026-05-20 17:23:34

Reddit热议!llama.cpp更新MTP,网友实测推理速度翻倍 推理部署 研究方向

16
3
  • 小陈 发表时间:2026-05-19 23:24:32 最新回复:2026-05-19 23:25:05

Reddit热议!蚂蚁1万亿参数AI模型开源引老外围观? 推理部署 研究方向

15
1
  • 小陈 发表时间:2026-05-19 17:35:46 最新回复:2026-05-19 17:37:17

24GB显存跑Qwen 27B终极指南:ik_llama.cpp+MTP量化封神 Qwen 推理部署 研究方向 国内模型

57
3
  • 小陈 发表时间:2026-05-17 23:50:50 最新回复:2026-05-17 23:52:21

Reddit热议!Strix Halo MTP实测:27B模型生成速度翻倍,35B表现不一 推理部署 研究方向

22
3
  • 小陈 发表时间:2026-05-17 17:38:59 最新回复:2026-05-17 17:40:30

Reddit热议!MTP正式合并入llama.cpp,网友实测性能飙升 推理部署 研究方向

21
3
  • 小陈 发表时间:2026-05-17 17:25:14 最新回复:2026-05-17 17:26:44

Reddit热议!MTP PR合并,llama.cpp迎来巨大生成加速 推理部署 研究方向

21
3
  • 小陈 发表时间:2026-05-16 16:17:03 最新回复:2026-05-16 16:18:34

本地运行Qwen 3.6 MTP模型:300K上下文实测与性能飞跃 Qwen 推理部署 研究方向 国内模型

61
3
  • 小陈 发表时间:2026-05-16 10:10:14 最新回复:2026-05-16 10:11:45

Orthrus新方案:冻结主模型,扩散头加速7.8倍 推理部署 研究方向

18
3
  • 小陈 发表时间:2026-05-16 09:52:38 最新回复:2026-05-16 09:53:10

35B科学模型通过任务扩展实现万亿级性能,获社区热评 推理部署 研究方向

15
1
  • 小陈 发表时间:2026-05-15 15:42:39 最新回复:2026-05-15 15:44:10

显卡涨价潮来袭,网友戏称“买5090不如称王” 推理部署 研究方向 技术工具

19
3
  • 小陈 发表时间:2026-05-15 11:27:40 最新回复:2026-05-15 11:29:10

VS Code新功能引争议:本地模型仍需联网付费 推理部署 研究方向 技术工具

16
3
  • 小陈 发表时间:2026-05-15 11:13:31 最新回复:2026-05-15 11:15:02

首次装机小白实测:RTX 5000 PRO 48GB显存性能惊艳 Qwen 推理部署 研究方向 国内模型

16
3
  • 小陈 发表时间:2026-05-15 02:54:59 最新回复:2026-05-15 02:56:31

旧显卡跑大模型:200美元二手机实现24+ tok/s 推理部署 研究方向 技术工具

21
3
  • 小陈 发表时间:2026-05-14 21:12:57 最新回复:2026-05-14 21:14:29

AI生成历史闹剧电影海报引热议 推理部署 研究方向 国外模型 GPT

20
3
  • 小陈 发表时间:2026-05-14 19:16:11 最新回复:2026-05-14 19:17:42

Qwen+MTP本地跑出34t/s,性能飙升40%引热议 Qwen 推理部署 研究方向 国内模型

20
3
  • 小陈 发表时间:2026-05-14 11:20:57 最新回复:2026-05-14 11:21:59

DramaBox:基于LTX 2.3的最具表现力开源语音模型,支持语音克隆 推理部署 研究方向 技术工具

18
2
  • 小陈 发表时间:2026-05-14 06:12:16 最新回复:2026-05-14 06:13:47

TextGen 推出原生桌面应用,开源替代LM Studio 推理部署 研究方向 技术工具

19
3
共90条 1 2 3 下一页