Reddit热议!英伟达发布“双塔”扩散语言模型,性能与速度引争议
2026-06-26 03:35:13
18次阅读
2个评论
英伟达发布基于扩散的Nemotron-TwoTower模型,采用冻结自回归塔与扩散去噪塔并行生成,吞吐量提升2.42倍且保留98.7%质量。网友热议其创新性,但质疑双倍权重与VRAM需求,认为更像“有损但更快”的变体,适合快速合成数据,同时肯定其为文本扩散研究提供了重要证明。
0
0
2026-06-26 03:35:46

回复 |
引用
2026-06-26 03:36:15

回复 |
引用
共2条
1
相关帖子
- Reddit热议Anthropic Opus 4.7模型性能与测试争议
- Reddit热议!Krea 2图像生成模型发布,网友实测性能引关注
- Open WebUI桌面版发布引Reddit用户热议功能与体验
- Reddit热议!百度发布3.3B多语言OCR模型Unlimited-OCR
- Reddit热议!中国黑客逆向工程英伟达V100显卡引老外惊叹
- Reddit热议!英伟达GB300工作站11万英镑天价引群嘲
- 英伟达CEO黄仁勋被问及对华售芯片时几乎失态引热议
- Reddit热议本地大模型:Qwen3.6比肩前沿模型引争议
- 通义千问Qwen3.6-27B开源发布,性能亮眼引热议
- GPT-5.5发布引热议:性能提升微弱,定价翻倍遭质疑