Reddit热议!NVIDIA语音模型移植C++,性能飙升5倍
2026-06-02 02:59:33
1次阅读
2个评论
开发者将NVIDIA Parakeet语音转文字模型移植到纯C++/ggml引擎,实现与NeMo逐字节一致的输出,速度提升最高5倍,内存减半,并支持GGUF量化。网友盛赞其比Whisper更快更准,期待支持Canary模型和NPU运行,也有用户希望独立于LocalAI使用OpenAI兼容API。
0
0
2026-06-02 03:00:06

回复 |
引用
2026-06-02 03:00:34

回复 |
引用
共2条
1