Reddit热议!50M参数小模型逆袭大模型,老外怎么看?
2026-05-23 16:25:36
14次阅读
3个评论
SupraLabs发布仅50M参数的Supra-50M模型,在多项基准测试中超越GPT-2(124M)等更大模型。网友惊叹其轻量高效,讨论GGUF兼容性、MoE架构可能性,开发者回应将研究Muon优化器并计划推出124M和350M版本。
收藏 0 0
    小陈 manage advert
    2026-05-23 16:26:09
    回复 |  引用
    小陈 manage advert
    2026-05-23 16:26:38
    回复 |  引用
    小陈 manage advert
    2026-05-23 16:27:07
    回复 |  引用
共3条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注