Reddit热议!国产NPU训练1.58比特大模型性能惊艳
2026-05-25 14:07:09
13次阅读
1个评论
在昇腾NPU上原生训练的1.58比特大模型BitCPM-CANN发布,1B至8B模型保留全精度95.7%-97.2%性能,训练仅增4.5%开销,推理内存节省8倍。网友惊叹其效率,但质疑0.5B数学短板,并讨论llama.cpp上运行的实际表现,期待未来MoE架构扩展。
收藏 0 0
    小陈 manage advert
    2026-05-25 14:07:42
    回复 |  引用
共1条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注