Voicebox是一款基于Meta AI非自回归流匹配模型构建的先进语音生成模型,通过学习解决基于海量数据的文本引导语音填充任务。Voicebox凭借其上下文学习能力,在语音任务中的表现超越了单一用途的 AI 模型。
AnyVoice是一款先进的AI声音克隆和生成软件,能够快速克隆声音并生成超真实的文本转语音,支持多种语言,包括英语、中文、日语和韩语,仅需3秒即可完成声音克隆,生成的声音与人类声音几乎无法区分。