2026-04-16 16:26:27
4次阅读
0个评论

谷歌AI刚推出了Gemini 3.1 Flash TTS,号称是目前表现力、可控性最强的文本转语音模型,还能用自然语言音频标签调语气语速,现在已经在Google Vids上线,Gemini API和Google AI Studio开放预览。

海外开发者都挺兴奋,大家好奇音质能不能打ElevenLabs、支不支持流输出,还问能不能做多人声、会不会集成到读书工具里。

0

登录 后评论。没有帐号? 注册 一个。

小陈

manage advert
  • 0 回答
  • 0 粉丝
  • 0 关注