Reddit热议!50M参数小模型逆袭大模型,老外怎么看?
2026-05-23 16:25:36
14次阅读
3个评论
SupraLabs发布仅50M参数的Supra-50M模型,在多项基准测试中超越GPT-2(124M)等更大模型。网友惊叹其轻量高效,讨论GGUF兼容性、MoE架构可能性,开发者回应将研究Muon优化器并计划推出124M和350M版本。
0
0
2026-05-23 16:26:09

回复 |
引用
2026-05-23 16:26:38

回复 |
引用
2026-05-23 16:27:07

回复 |
引用
共3条
1