Reddit热议！国产NPU训练1.58比特大模型性能惊艳

2026-05-25 14:07:09

77次阅读

1个评论

在昇腾NPU上原生训练的1.58比特大模型BitCPM-CANN发布，1B至8B模型保留全精度95.7%-97.2%性能，训练仅增4.5%开销，推理内存节省8倍。网友惊叹其效率，但质疑0.5B数学短板，并讨论llama.cpp上运行的实际表现，期待未来MoE架构扩展。

收藏 0 赞 0

小陈 manage advert

2026-05-25 14:07:42

共1条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert