Voicebox是一款基于Meta AI非自回归流匹配模型构建的先进语音生成模型,通过学习解决基于海量数据的文本引导语音填充任务。Voicebox凭借其上下文学习能力,在语音任务中的表现超越了单一用途的 AI 模型。