Reddit热议!英伟达发布“双塔”扩散语言模型,性能与速度引争议
2026-06-26 03:35:13
18次阅读
2个评论
英伟达发布基于扩散的Nemotron-TwoTower模型,采用冻结自回归塔与扩散去噪塔并行生成,吞吐量提升2.42倍且保留98.7%质量。网友热议其创新性,但质疑双倍权重与VRAM需求,认为更像“有损但更快”的变体,适合快速合成数据,同时肯定其为文本扩散研究提供了重要证明。
收藏 0 0
    小陈 manage advert
    2026-06-26 03:35:46
    回复 |  引用
    小陈 manage advert
    2026-06-26 03:36:15
    回复 |  引用
共2条 1

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注