Reddit热议！英伟达发布“双塔”扩散语言模型，性能与速度引争议

2026-06-26 03:35:13

18次阅读

2个评论

英伟达发布基于扩散的Nemotron-TwoTower模型，采用冻结自回归塔与扩散去噪塔并行生成，吞吐量提升2.42倍且保留98.7%质量。网友热议其创新性，但质疑双倍权重与VRAM需求，认为更像“有损但更快”的变体，适合快速合成数据，同时肯定其为文本扩散研究提供了重要证明。

收藏 0 赞 0

小陈 manage advert

2026-06-26 03:35:46

小陈 manage advert

2026-06-26 03:36:15

共2条 1 / 1页

请登录后评论。没有帐号？注册一个。

manage advert