AI 大模型资源圈

国内外大模型资源分享、技术交流、实用工具、场景应用与资源分类整理。

  • 小陈 发表时间:2026-05-29 06:07:59 最新回复:2026-05-29 06:09:01

Reddit热议!Zai用新网络架构让AI推理成本降33%、性能反升15% 架构技术 研究方向 GLM 国内模型

5
2
  • 小陈 发表时间:2026-05-23 16:25:36 最新回复:2026-05-23 16:27:07

Reddit热议!50M参数小模型逆袭大模型,老外怎么看? 架构技术 研究方向

14
3
  • 小陈 发表时间:2026-05-14 21:28:41 最新回复:2026-05-14 21:29:14

AI视频生成:场景级控制比单次提示更关键 架构技术 研究方向 技术工具

14
1
  • 小陈 发表时间:2026-05-14 05:04:51 最新回复:2026-05-14 05:05:24

Ovis2.6-80B-A3B发布:MoE架构,低推理成本高多模态性能 架构技术 研究方向

12
1
  • 小陈 发表时间:2026-05-13 23:17:13 最新回复:2026-05-13 23:18:16

MagicQuant v2.0:混合GGUF量化与动态学习配置 架构技术 研究方向 技术工具

20
2
  • 小陈 发表时间:2026-05-12 20:50:13 最新回复:2026-05-12 20:50:46

MiniCPM 4.6登Reddit引热议:量化选择、适用场景等成讨论焦点 架构技术 研究方向

17
1
  • 小陈 发表时间:2026-05-11 13:51:35 最新回复:2026-05-11 13:52:08

小公司靠28nm老芯片造AI加速器 240W跑700B大模型挑战AMD英伟达 架构技术 研究方向

22
1
  • 小陈 发表时间:2026-05-10 19:51:06 最新回复:2026-05-10 19:52:08

YC投资公司用AI运营真实业务8个月,曝自主AI决策核心问题 架构技术 研究方向 应用

16
2
  • 小陈 发表时间:2026-05-10 19:41:21 最新回复:2026-05-10 19:42:51

英伟达发布Star Elastic嵌套AI模型 单检查点支持3种参数规模零样本切换 架构技术 研究方向

19
3
  • 小陈 发表时间:2026-05-08 13:16:25 最新回复:2026-05-08 13:17:55

网友攒2.3TB内存异构AI集群 求Tinygrad驱动合作 架构技术 研究方向 技术工具

23
3
  • 小陈 发表时间:2026-05-08 01:23:21 最新回复:2026-05-08 01:24:51

AMD推出PCIe版CDNA4架构Instinct MI350P加速器引热议 架构技术 研究方向 技术工具

25
3
  • 小陈 发表时间:2026-05-07 02:10:59 最新回复:2026-05-07 02:12:00

SubQ宣称12M代币亚二次注意力 引Reddit网友热议 架构技术 研究方向

22
2
  • 小陈 发表时间:2026-05-03 14:25:39 最新回复:2026-05-03 14:26:41

开发者纯C++17从零打造无依赖Transformer引网友热议 架构技术 研究方向 国外模型 GPT

21
2
  • 小陈 发表时间:2026-04-30 17:46:27 最新回复:2026-04-30 17:47:58

Qwen推出FlashQLA高性能线性注意力内核 仅支持SM90及以上GPU Qwen 架构技术 研究方向 国内模型

73
3
  • 小陈 发表时间:2026-04-19 04:39:12

博主吐槽YouTube“氛围编码赚百万”是骗局 架构技术 研究方向 国外模型 Claude

47
0
  • 小陈 发表时间:2026-04-16 07:49:54

Reddit热议:大模型预测下一个词难实现严格逻辑推理 架构技术 研究方向

45
0
  • 小陈 发表时间:2026-04-10 13:51:39

Reddit热帖讨论中国AI迭代快成本低,西方应对存疑 架构技术 研究方向 GLM 国内模型

132
0
共17条 1