2026-04-16 16:25:30
4次阅读
0个评论

Google刚发布了Gemini 3.1 Flash TTS,号称目前表现力可控性最强的文本转语音,还加了个很妙的音频标签功能,直接在文本里加标签就能调语气语速,现在开放预览,所有生成音频都带SynthID水印。


海外网友都夸音频标签这个设计戳中痛点,创作者都迫不及待想试,但也有不少人吐槽现有API老报错,还有人问能不能语音克隆、出本地模型。

0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注